Неліктен суретті тану маңызды?

Интернеттегі заттардың шамамен 80% -ы визуалды. Сіз суретті таңбалау неліктен субстанциялар кестесінің иесі ретінде орын алатынын анықтауға кірісе аласыз. Адамдар немесе ұйымдар ма, қарамастан, AI кескінді тану Интернеттегі көрнекі бейнелерді елеусіз нысанмен ажыратуға мүмкіндік берді. Мұнда жыл сайын 657 миллиардқа жуық фотосурет мұқият орналастырылады, олардың басым бөлігі онлайн БАҚ арқылы көрсетіледі. Бұл суреттердің лайықты бөлігі - бұл кездейсоқ жасағанына қарамастан, элементтерді алға жылжытатын адамдар. Клиент шығарған мазмұн (UGC) өзінің ең мінсіз құрылымында брендтер үшін керемет күшейтетін әсер болып табылады, өйткені ол ілгерілеудің ең тамаша түрін береді.

Интернет-БАҚ арқылы сатып алушы туралы хабарлама болған кезде ұйымдарды дабыл қағуға арналған жарнамалық құрылғылар бар, бірақ әлеуметтік постта олардың атын ешкім белгілемей, брендтердің алға жылжуы туралы бірдеңе айту керек емес пе? Бұл AI кескінді тану оның құндылығын көрсететін орын. Технология дұрыс деректер жиынтығына қамқорлық жасаса, AI суретті анық белгісіз ажырата алады. Нәтижелер брендтер үшін олардың әлеуметтік ескертулерін қадағалау және қадағалау үшін маңызды.

Кескінді тану қалай жұмыс істейді?

Біз білетіндей, AI фотосуреттерді іздеудің веб-негізіндегі медиа кезеңдерін қарап, оларды кең ақпараттық жинақтармен салыстыра алады. Бұл кезде ол адамдар жасай алатындан әлдеқайда жылдамырақ сәйкес келетін сәйкес суретті таңдайды. Брендтер веб-негізделген медиа арқылы өздеріне ұқсас мазмұнды табу үшін суретті растауды пайдаланады. Бұл брендтің логотипін ажыратуды немесе веб-негізделген медиа клиенттері арасында табиғи түрде орналасқан элемент жағдайын қабылдауды білдіреді. Адамдардың осындай көп деректер арқылы тиімді түрде балық аулауын сұрау шаршатады. Модельдік интеллект адамның өрескел қателігіне баса назар аудармайды және дәл нәтижелерді теңдессіз деңгейде қайтарады. Жасанды интеллект суретін растау мәтінді талап етпей-ақ тұлғалардың бренд туралы не айтқанын көрсетеді. Клиенттер ұйымның атын теруді күтпестен өздерінің әлеуметтік ескертулерін орындауға дайын брендтер баға жетпес позицияға ие болады. Тек қана AI қабылданатын идентификаторлар арқылы өздерінің онлайн қосылуының артықшылығын пайдалану мүмкіндігі өте зор және теңдесі жоқ қосуды ұсынады.

Міне, суретті танудың кейбір қарапайым тапсырмалары: -

Басынан бастап сурет ақпаратында белгілі бір мақала, бөлектеу немесе қозғалыс бар-жоғын анықтауымыз керек. Бұл тапсырманы әдетте шын жүректен және адам күш-жігерінсіз шешуге болады, бірақ жалпы жағдай үшін ДК көзқарасында әлі жеткілікті түрде шешілмеген: дискрециялық жағдайларда өзін-өзі растайтын мақалалар. Бұл мәселені басқарудың қазіргі әдістері тек анық мақалалар үшін, мысалы, негізгі математикалық элементтер (мысалы, көп қырлы), адам беттері, басып шығарылған немесе транскрипцияланған таңбалар немесе көлік құралдары және айқын жағдайларда, әдетте барлығына дейін бейнеленген ең жақсы түрде шешілуі мүмкін. камерамен салыстырмалы түрде сипатталған жарықтандыру, негіз және заттың қалпы айналасында. Жазбада растау мәселесінің әртүрлі ассортименті бейнеленген:

• Объектіні тану

Бір немесе бірнеше алдын ала анықталған немесе үйренген мақалалар немесе элементтер сыныптары әдетте суреттегі 2D жағдайларымен немесе сахнадағы 3D қалыптарымен бірге қабылдануы мүмкін.

• Сәйкестендіру

Мақаланың жеке жағдайы қабылданады. Модельдер белгілі бір тұлғаның бет-әлпетін немесе бірегей белгісін немесе белгілі бір көлік құралының идентификаторын ажырататын дәлел болып табылады.

• Анықтау

Сурет туралы ақпарат белгілі бір жағдай үшін зерттеледі. Модельдер - бұл клиникалық суреттерде ойластырылған оғаш жасушаларды немесе тіндерді табу немесе бағдарламаланған көше құны шеңберінде көлікті тану. Орташа қарапайым және жылдам есептеулерге байланысты табу мұнда және мұнда дұрыс аударма жасау үшін көбірек есептеу стратегиялары арқылы қосымша бөлшектеуге болатын қызықты сурет ақпаратының қарапайым аудандарын табу үшін пайдаланылады.

Мойындауға тәуелді бірнеше нақты міндеттемелер бар, мысалы,

• Мазмұнға негізделген суретті қалпына келтіру

Мұнда белгілі бір мазмұнға ие суреттердің үлкен орналасуында барлық суреттерді табады. Зат күтпеген жолмен анықталуы мүмкін, мысалы, объективті суретке ұқсастық тұрғысынан (маған X суреті сияқты барлық суреттерді беріңіз) немесе мәтін енгізу ретінде берілген маңызды деңгейге ұмтылу стандарттары (маған көптеген суреттері бар барлық суреттерді беріңіз). үйлер, қыста алынған және ішінде көліктері жоқ).

• Позаны бағалау

белгілі бір мақаланың орнын немесе бағытын камерамен салыстыра отырып өлшеуіміз керек. Бұл стратегияға арналған үлгі қолданбасы роботқа механикалық өндіріс жүйесі жағдайында көлік желісінен элементтерді қалпына келтіруге көмектеседі.

• Оптикалық таңбаны растау

Басып шығарылған немесе қолмен жазылған мазмұндағы суреттердегі кейіпкерлерді ажырататын OCR, негізінен ұйымдағы мазмұнды көбірек кодтау және Мичиган мемлекеттік университетінің Информатика және инженерия бөлімін өзгерту немесе тапсырыс беру мүмкіндігін беру. Стратегиялар объектілерді анықтау, олардың қайсысы басқалардан ерекшеленетінін табу және сипаттаманы орындау үшін машина пайдалана алатын есептеулерді жоспарлау үшін жасалады. Маңызды қолданбалар бетті тануды, саусақ ізін тануға болатын дәлелдемені, суретті жазуды тексеруді, 3D мақала үлгісін әзірлеуді, робот бағытын және 3D көлемді ақпаратты ұсынуды/зерттеуді қамтиды. Ebb and flow зерттеу мәселелері биометриялық растауды, бағдарламаланған бақылауды және бақылауды, қолсыз HCI, бетті көрсету, компьютерлік су таңбалауды және онлайн мұрағаттарды зерттеу дизайнын қамтиды. Зертхананың кеш түлектері қаламгерлікті растау, қолтаңбаны тексеру, визуалды оқыту және суретті қалпына келтірумен айналысты ».

Үлгі:

MIT маманы жүргізген топ суреттің тақырыбын тану мүмкіндігіне ие болу үшін таңқаларлық бірнеше пиксель деректер қажет екенін көруіміз керек. Ашылу онлайн суреттердің механикаландырылған танылатын дәлелдерінде ерекше жетістіктерге жетуге және, сайып келгенде, ДК-ге адамдар сияқты көруге негіз бере алады. Ерекше қысқа бейнені шығару, нәтижесінде Интернеттегі миллиардтаған суреттерді түгендеуге мүмкіндік беретін маңызды ілгерілеу болар еді. Қазіргі уақытта суреттерді іздеудің жалғыз тәсілдері әр сурет үшін жеке адамдар қолмен енгізген мазмұн жазуларына байланысты және көптеген суреттер мұндай деректерді қажет етеді. Бағдарламаланған идентификатор сонымен қатар жеке адамдарға компьютерленген камералардан компьютерлеріне жүктеп алатын файлдарды суретке түсіруге мүмкіндік береді, олардың әрқайсысын қолмен көрмей және субтитрсіз. Сондай-ақ, ақырында бұл роботтарға камераларынан келетін ақпаратты сұрыптауға және олардың қайда екенін анықтауға мүмкіндік беретін шынайы машиналық көруді тудыруы мүмкін. Осылайша, егер екі суреттің салыстырмалы топтамасы [сандар] болса, олар салыстырмалы болуы мүмкін. жалпы ұқсас баптан, жалпы ұқсас келісімнен жасалған». Егер бір сурет жазуға немесе тақырыпқа қатысты болса, сол кезде оның математикалық кодын үйлестіретін әртүрлі суреттер ұқсас элементті (мысалы, көлік, ағаш немесе жеке тұлға) көрсетуі мүмкін, осылайша бір суретке қатысты атау болуы мүмкін. басқаларына көшті. «Суреттер өте көп болса, тіпті қарапайым есептеулер де суреттерді тану үшін шынымен жақсы нәтиже береді».

⦁ Бет-әлпетті тану

біз жүзді растау шеңберлерінің биометриялық деректерді жою әдістері ретінде үнемі танымал болып келе жатқанын түсінеміз. Бетті растау биометриялық құрылымдарда негізгі бөлікке ие және визуалды барлау мен қауіпсіздікті қоса алғанда, әртүрлі қолданбалар үшін тартымды. Түрлі есептердегі бет суреттерін жалпы халықтың мойындауын ескере отырып, бет-әлпетті растау шешімнің ең озық биометриялық инновациясына айналу үшін керемет әлеуетке ие.

Суретті тану жүйелері

⦁ Қозғалыс сараптамасы

Бірнеше тапсырмалар суреттегі әрбір фокуста немесе 3D көрінісінде, тіпті суреттерді жеткізетін камерада жылдамдық өлшемін жасау үшін сурет сабақтастығы дайындалатын қозғалысты бағалаумен анықталады. Мұндай тапсырмалардың мысалдары:

⦁ Эго қозғалысы

Камераның 3D икемсіз қозғалысын (бұрылу және интерпретация) камерамен жасалған сурет сабақтастығынан анықтау.

⦁ Бақылау

Төменде сурет қатарындағы қызығушылық ошақтары немесе наразылықтардың (мысалы, көліктер немесе адамдар) (жалпы) қарапайым орналасуының дамуын бақылайтын болады.

⦁ Оптикалық ағын

Бұл суреттегі әрбір нүкте үшін бұл нүктенің сурет жазықтығымен салыстырмалы түрде қалай қозғалатынын, яғни оның айқын қозғалысын шешу керек. Бұл қозғалыс салыстырылатын 3D нүктесінің көріністе қалай қозғалатынын және камераның көрініспен салыстырмалы түрде қалай қозғалатынын көрсететін нәтиже болып табылады.

⦁ Сахнаны қайта жасау

Сахнаның бір немесе (әдетте) бірнеше суретін немесе бейнені ескере отырып, көріністі жаңғырту көріністің 3D үлгісін тіркейді. Ең оңай жағдайда модель 3D фокустарының жиынтығы болуы мүмкін. Неғұрлым нақтыланған стратегиялар жалпы 3D бетінің үлгісін жасайды

⦁ Кескінді қалпына келтіру

Суретті қалпына келтірудің мәні - суреттерден дүрбелеңді (датчиктердің шуы, қозғалыстың түсініксіздігі және т.б.) эвакуациялау. Төмен жиіліктегі арналар немесе орта арналар сияқты, әр түрлі арналар түрін әбігерден шығарудың ең аз күрделі әдістемесі болып табылады. Неғұрлым заманауи стратегиялар маңайдағы сурет құрылымдарының қалай ұқсайтынының үлгісін, оларды дүрбелеңнен танитын модельді күтеді. Алдымен жақын жердегі сурет құрылымдарының, мысалы, сызықтар немесе жиектердегі сурет туралы ақпаратты зерттеп, содан кейін көршілес деректерге тәуелділікті тексеру қадамынан бөлуді бақылай отырып, әбігерді эвакуациялаудың жоғары дәрежесі әдетте азырақ суретке қарама-қайшы келеді. күрделі әдістемелер. Бұл саладағы үлгі - олардың кескіндемесі. Кейбір құрылымдар белгілі бір бағалау немесе тану мәселесін қарастыратын тәуелсіз қолданбалар болып табылады, ал басқалары, мысалы, механикалық жетектерді басқаруға, реттеуге, деректердің ақпараттық базасына, басқаруға арналған қосалқы құрылымдарды қамтитын үлкенірек жоспардың қосалқы құрылымын қамтиды. машина интерфейстері және т.б. ДК көру құрылымының нақты орындалуы да оның пайдалылығы алдын ала анықталғанына немесе оның кейбір бөлігінің әрекет кезінде өте жақсы меңгерілуіне немесе реттелуіне байланысты. Қалай болғанда да, көптеген ДК көруінде кездесетін тұрақты қуаттар бар