Сүрөттү таануу эмне үчүн маанилүү?

Интернеттеги заттын болжол менен 80% визуалдык. Сиз эмне үчүн сүрөттүн этикеткалоо зат таблицасынын мырзасы катары өз ордун ээлей аларын иштеп баштасаңыз болот. Адамдарбы же уюмдарбы, AI сүрөтүн таануу онлайндагы визуалдык көрүнүштөрдү анча маанилүү эмес объект менен айырмалоого мүмкүнчүлүк берди. Жыл сайын 657 миллиардга жакын сүрөттөр кылдаттык менен жайгаштырылат, алардын көбү онлайн медиа аркылуу көрсөтүлөт. Бул сүрөттөрдүн татыктуу бөлүгү, алар кокустан жасап жатканына карабастан, нерселерди алдыга жылдырган адамдар. Кардар тарабынан өндүрүлгөн мазмун (UGC) өзүнүн эң идеалдуу түзүмүндө бренддер үчүн жаркыраган күчтүү таасир этет, анткени ал эң идеалдуу прогрессти берет.

Онлайн медиа аркылуу сатып алуучуга эскертүү болгондо, уюмдарды сигнализациялоо үчүн жарнамалык түзүлүштөр бар, бирок социалдык постто алардын атын эч ким белгилебестен, бренддердин өнүгүүсү жөнүндө бир нерсе айтыш керек эмеспи? Бул AI сүрөтүн таануу өзүнүн баалуулугун көрсөткөн жер. Технология туура маалымат топтомуна кам көргөндө, AI ачык белгилөөсүз сүрөттү айырмалай алат. Натыйжалар бренддер үчүн алардын социалдык эскертүүлөрүнө көз салуу жана аткаруу үчүн маанилүү.

Сүрөттү таануу кантип иштейт?

Биз билгендей, AI сүрөттөрдү издөөнүн веб-негизделген медиа баскычтарын карап, аларды кеңири маалыматтык коллекциялар менен салыштыра алат. Ал ошол учурда адамдар жасай алгандан бир топ тез ылдамдыкта дал келген тиешелүү сүрөттү тандайт. Бренддер веб-негизделген медиа аркылуу өзүнө окшош мазмунду табуу үчүн сүрөттү ырастоону колдонушат. Бул бренддин логотибин айырмалоону же веб-негизделген медиа кардарлардын арасында табигый жайгашкан пункттун абалын кабыл алууну билдирет. Адамдардын ушунчалык көп маалымат аркылуу балык уулоосун талап кылуу, чарчатат. Симуляцияланган интеллект адамдын катасын баса белгилебейт жана теңдешсиз деңгээлде так натыйжаларды берет. Жасалма интеллекттин сүрөтүн таануу экраны текстти талап кылбастан, адамдар бренд жөнүндө эмнени айтып жатканын көрсөтөт. Кардарлар уюмдун атын терүүнү күтпөстөн, социалдык эскертүүлөрүн аткарууга даяр бренддер баа жеткис позицияга ээ болушат. AI кабыл алынган идентификаторлор аркылуу гана өздөрүнүн онлайн инклюзиясынан пайдалануу мүмкүнчүлүгү абдан чоң жана теңдешсиз инклюзивди сунуш кылат.

Сүрөттү таануунун кээ бир кеңири таралган тапшырмалары: -

Башынан эле сүрөт маалыматында кандайдыр бир макала, өзгөчөлүктөр же кыймыл бар-жогун чечишибиз керек. Бул тапшырма, адатта, адам тарабынан чын жүрөктөн жана эч кандай күч-аракет жумшабастан чечилиши мүмкүн, бирок жалпы иш үчүн PC көрүнүшүндө азырынча жетиштүү түрдө чечиле элек: дискрециялуу жагдайларда өзүн-өзү ырастаган макалалар. Бул маселени чечүүнүн учурдагы ыкмаларын, мисалы, негизги математикалык предметтер (мисалы, көп кырдуу), адамдын жүзү, басылган же транскрипцияланган символдор же транспорт каражаттары, ошондой эле ачык-айкын жагдайларда, адатта, бардыгына чейин сүрөттөлгөн ачык макалалар үчүн эң жакшы чечүүгө болот. камерага салыштырмалуу буюмдун мүнөздүү жарыктанышы, негизи жана абалы. жазууда моюнга алуу маселесинин ар кандай ассортименти чагылдырылган:

• Объектти таануу

Бир же бир нече алдын ала аныкталган же үйрөнүлгөн макалалар же предмет класстары, адатта, алардын сүрөттөгү 2D кырдаалдары же сахнадагы 3D позалары менен бирге кабыл алынышы мүмкүн.

• Идентификация

Макаланын жеке иши кабыл алынат. Модельдер белгилүү бир адамдын жүзүн же уникалдуу белгисин, же белгилүү бир унаанын ID-сын айырмалоочу далили болуп саналат.

• аныктоо

Сүрөт маалымат белгилүү бир шарт үчүн каралат. Модельдер - бул клиникалык сүрөттөрдө ойго келген кызыктай клеткалардын же ткандардын ачылышы же программаланган көчө наркынын алкагында унааны таануу. Орточо жөнөкөй жана тез эсептөөлөргө көз каранды ачылыш бул жерде жана бул жерде кызыктуу сүрөт маалыматынын жупуну райондорун табуу үчүн колдонулат, аны кошумча түрдө туура котормону түзүү үчүн көбүрөөк эсептөө талап кылган стратегиялар менен бөлүүгө болот.

Таанууга көз каранды бир нече конкреттүү милдеттенмелер бар, мисалы,

• Мазмунга негизделген сүрөттү калыбына келтирүү

Бул жерде белгилүү бир затка ээ болгон сүрөттөрдүн чоңураак жайгашуусундагы бардык сүрөттөрдү табуу. Зат күтүлбөгөн түрдө аныкталышы мүмкүн, мисалы, объективдүү сүрөттүн окшоштугуна жараша (мага X сүрөтү сыяктуу бардык сүрөттөрдү бериңиз) же текст киргизүү катары берилген олуттуу деңгээлдеги умтулуу стандарттарына чейин (мага көптөгөн сүрөттөрдү камтыган бардык сүрөттөрдү бериңиз) үйлөр, кышында алынган жана аларда транспорт жок).

• Баа берүү

биз камера менен салыштырып белгилүү бир макаланын абалын же багытын өлчөө керек. Бул стратегиянын моделдик колдонмосу механикалык өндүрүш системасынын шартында транспорттук линиядан буюмдарды калыбына келтирүүгө роботко жардам берет.

• Оптикалык белгини таануу

OCR, бул басылып чыккан же кол менен жазылган мазмундагы сүрөттөрдөгү каармандарды айырмалоочу, көбүнчө уюмдагы мазмунду көбүрөөк коддоо жана Мичиган мамлекеттик университетинин Информатика жана инженерия бөлүмүн өзгөртүү же буйрутма берүү максатын көздөйт. Стратегиялар объектилерди аныктоо, алардын кайсынысы аларды башкалардан тааный турганын табуу жана мүнөздөмөлөрдү жасоо үчүн машина тарабынан колдонула турган эсептөөлөрдү пландаштыруу үчүн түзүлөт. Маанилүү тиркемелер жүздү таанууну, манжалардын таасири менен таанылуучу далилдерди, рекорддук сүрөт экспертизасын, 3D макала моделин иштеп чыгууну, роботтун маршрутун жана 3D көлөмдүү маалыматты көрсөтүүнү/иликтөөнү камтыйт. Ebb and flow изилдөө маселелери биометрикалык ырастоону, программаланган байкоону жана кийинки, колсуз HCI, бетти көрсөтүү, компьютердик суу белгисин жана онлайн архивдердин дизайнын текшерүүнү камтыйт. Лабораториянын акыркы бүтүрүүчүлөрү калемгерликти таануу, кол тамгаларды текшерүү, визуалдык үйрөнүү жана сүрөттөрдү калыбына келтирүү менен алектеништи.

модели:

Сүрөттүн предметин таануу мүмкүнчүлүгүнө ээ болуу үчүн таң калыштуу бир нече пикселдик маалымат талап кылынарын көрүшүбүз керек, MIT адиси башкарган топ. Аян онлайн сүрөттөрүнүн механикалаштырылган таанымал далилдеринде укмуштуудай ийгиликтерди жаратышы мүмкүн жана акырында, компьютерлерге адамдар сыяктуу көрүүгө мүмкүнчүлүк берет. Өзгөчө кыска сүрөттөлүштүн натыйжасы Интернеттеги миллиарддаган сүрөттөрдү инвентаризациялоо үчүн олуттуу прогресс болмок. Азырынча сүрөттөрдү издөөнүн жалгыз ыкмалары ар бир сүрөт үчүн жеке адамдар кол менен киргизген мазмундук жазуулардан көз каранды жана көптөгөн сүрөттөр мындай маалыматтарга муктаж. Программаланган идентификатор ошондой эле жеке адамдарга компьютерлештирилген камералардан компьютерлерине жүктөп алып, алардын ар бирине кол менен субтитр койбостон, файлга сүрөт тартуу ыкмасын берет. Ошондой эле, акыры, ал чыныгы машина көрүүсүнө түрткү бериши мүмкүн, бул кээде роботторго камераларынан келген маалыматты сорттоого жана алардын кайда экенин аныктоого мүмкүндүк берет. Ошентип, эгерде эки сүрөт [сандардын] салыштырылуу тобуна ээ болсо, алар салыштырмалуу болушу мүмкүн. жалпысынан окшош беренеден, жалпысынан окшош түзүлүштөн жасалган». Эгерде бир сүрөт жазууга же аталышка байланыштуу болсо, анда анын математикалык кодун координациялаган ар кандай сүрөттөр, кыязы, окшош нерсени (мисалы, транспорт каражатын, даракты же жеке адамды) көрсөтүшү мүмкүн, андыктан бир сүрөткө байланыштуу аталыш болушу мүмкүн башкаларга көчтү. "Сүрөттөрдүн абдан көп болушу менен, жалпысынан жөнөкөй эсептөөлөр да чындап жакшы аткара алат" сүрөттөрдү ушинтип таанууда.

⦁ Жүздү таануу

Биз жүздү таануу алкактары биометрикалык маалыматтарды алып салуу ыкмалары катары тынымсыз атактуу болуп жатканын түшүнөбүз. Жүз менен таануу биометрикалык негиздердеги негизги бөлүккө ээ жана визуалдык чалгындоо жана коопсуздук сыяктуу ар кандай колдонмолор үчүн жагымдуу. Ар кандай отчеттордо жүз сүрөттөрүн жалпы калктын таануусун эске алуу менен, жүзүн таануу чечимдин эң алдыңкы биометрикалык инновациясына айлануу үчүн укмуштуудай потенциалга ээ.

Сүрөттөрдү таануу системалары

⦁ Кыймыл экспертизасы

Бир нече тапшырмалар кыймылды баалоо менен аныкталат, бул жерде сүрөттөгү ар бир фокуста же 3D сахнасында, жада калса сүрөттөрдү жеткирүүчү камерада ылдамдыктын өлчөгүчүн түзүү үчүн сүрөттөрдүн тизмеги даярдалат. Мындай тапшырмалардын учурлары болуп төмөнкүлөр саналат:

⦁ Эго кыймылы

Камеранын 3D ийкемсиз кыймылын (бурулуш жана интерпретациялоо) камера тарабынан түзүлгөн сүрөт ырааттуулугунан чечүү.

⦁ Көз салуу

Төмөндө сүрөттөрдүн кезектегисинде (негизинен) кызыкчылыктын фокустарынын же нааразылык акцияларынын (мисалы, унаалар же адамдар) кыйла жупунураак жайгашуусу боюнча өнүгүүлөр каралат.

⦁ Оптикалык агым

Бул сүрөттөгү ар бир чекит үчүн, ал чекиттин сүрөт тегиздигине салыштырмалуу кандайча жылып жатканын, б.а. анын ачык кыймылын чечиш керек. Бул кыймыл салыштыруучу 3D чекитинин сахнада кандайча жылып жатканынын жана камеранын көрүнүш менен салыштырып кыймылынын натыйжасы.

⦁ Сахнаны кайра жасоо

Сахнанын бир же (адатта) бир нече сүрөтүн же видеону эске алуу менен, сахнанын 3D моделин каттаган көрүнүштү репродукциялоо максатын көздөйт. Эң жөнөкөй учурда модель 3D фокустарынын бир тобу болушу мүмкүн. Көбүрөөк такталган стратегиялар жалпы 3D беттик моделин чыгарат

⦁ Сүрөттү калыбына келтирүү

Картинаны кайра куруунун максаты - сүрөттөрдөн дүрбөлөңдү (сенсордук ызы-чуу, кыймылдын бүдөмүк жана башкалар) эвакуациялоо. Тополоңду чыгаруунун эң аз татаал методологиясы – бул ар кандай каналдар, мисалы, төмөнкү же орто каналдар. Көбүрөөк заманбап стратегиялар кошуналык сүрөт структураларынын кандайча окшоштугунун моделин, аларды дүрбөлөңдөн тааный турган моделди күтөт. Адегенде жакын жердеги сүрөт түзүмдөрүнүн, мисалы, сызыктардын же четтердин бир топ убакытында сүрөт маалыматын изилдеп, андан кийин кошуна маалыматтарга көз карандылыкты текшерүү кадамынан бөлүүнү көзөмөлдөө менен, адатта, ызы-чууну эвакуациялоонун жогорку даражасы азыраак менен карама-каршы келет. комплекстүү методологиялар. Бул тармактагы үлгү алардын сүрөтү болуп саналат. Бир нече алкактар ​​белгилүү бир баалоо же таануу маселесин чечүүчү көз карандысыз тиркемелер, ал эми башкалары, мисалы, механикалык кыймылдаткычтарды башкаруу, уюштуруу, маалымат базалары, адам машина интерфейстери ж.б.у.с. PC көрүү алкагынын өзгөчө аткарылышы анын пайдалуулугу алдын ала аныкталган болсо же иш учурунда анын кандайдыр бир бөлүгү абдан жакшы үйрөнүлүп же туураланса, ошого жараша болот. Кандай болбосун, көптөгөн PC көрүнүштөрүндө табылган үзгүлтүксүз мүмкүнчүлүктөр бар