Чаро шинохти тасвир муҳим аст?

Тақрибан 80 дарсади мундариҷаи интернет визуалӣ мебошанд. Шумо аллакай метавонед ба кор шурӯъ кунед, ки чаро тамғагузории тасвир метавонад ҳамчун подшоҳи ҷадвали мундариҷа ҷои худро дошта бошад. Новобаста аз он ки ин шахсони алоҳида ё ширкатҳо ҳастанд, шинохти тасвири AI имкон дод, ки визуалӣ онлайн бо ҳадди ақали ғавғо муайян карда шавад. Ҳар сол тақрибан 657 миллиард аксҳо ба таври рақамӣ ҷойгир карда мешаванд, ки аксарияти онҳо дар шабакаҳои иҷтимоӣ пайдо мешаванд. Қисми хуби ин тасвирҳо одамоне мебошанд, ки маҳсулотро таблиғ мекунанд, ҳатто агар онҳо нохост ин корро кунанд. Мундариҷаи аз ҷониби корбар тавлидшуда (UGC) дар шакли тозаи худ як имкондиҳандаи олӣ барои брендҳо мебошад, зеро он беҳтарин намуди таблиғотро таъмин мекунад.
Воситаҳои маркетингӣ вуҷуд доранд, ки ширкатҳоро огоҳ кунанд, вақте ки истеъмолкунанда дар васоити ахбори иҷтимоӣ ёдовар мешавад, аммо вақте ки таблиғи брендҳо бидуни қайд кардани номи онҳо дар паёми иҷтимоӣ сурат мегирад? Дар ин ҷо шинохти тасвири AI арзиши онро исбот мекунад. Агар технология бо маҷмӯи додаҳои дуруст таъмин карда шавад, AI метавонад тасвирро бидуни зикри барчаспҳои мушаххас муайян кунад. Натиҷаҳо барои брендҳо барои пайгирӣ ва пайгирии зикри иҷтимоии онҳо бебаҳо мебошанд.

Шинохти тасвир чӣ гуна кор мекунад?

Тавре ки мо медонем, AI метавонад дар платформаҳои васоити ахбори иҷтимоӣ дар ҷустуҷӯи аксҳо ҷустуҷӯ кунад ва онҳоро бо маҷмӯи васеи маълумот муқоиса кунад. Он гоҳ он дар бораи тасвири мувофиқ қарор қабул мекунад, ки бо суръати тезтар аз қобилияти одамон мувофиқат мекунад. Брендҳо барои дарёфти мундариҷаи шабеҳи худ дар шабакаҳои иҷтимоӣ шинохти тасвирро истифода мебаранд. Ин маънои онро дорад, ки логотипи бренд ё эътироф кардани ҷойгиркунии маҳсулоти органикӣ дар байни корбарони ВАО иҷтимоӣ. Аз одамон талаб кардани маълумоти зиёд ба осонӣ хаста мешавад. AI дар бораи хатогии инсон хавотир намешавад ва натиҷаҳои дақиқро дар сатҳи беҳамто бармегардонад. Шинохти тасвири AI назорат мекунад, ки одамон дар бораи бренд чӣ мегӯянд, бидуни ниёз ба матн. Брендҳое, ки метавонанд зикри иҷтимоии худро бидуни ниёз ба навиштани номи ширкат пайгирӣ кунанд, худро дар мавқеи муфид пайдо мекунанд. Имконияти ворид кардани фарогирии онлайни худ танҳо тавассути идентификаторҳои эътирофшудаи AI бузург аст ва фарогирии беҳамторо пешниҳод мекунад.

Инҳоянд баъзе вазифаҳои маъмулии шинохти тасвир: -

Дар аввал мо бояд муайян кунем, ки оё маълумоти тасвир дорои ягон объект, хусусият ё фаъолияти мушаххас аст. Одатан, ин вазифаро инсон устуворона ва бе саъю кӯшиш ҳал карда метавонад, аммо дар биниши компютерӣ барои ҳолати умумӣ: объектҳои худсарона дар ҳолатҳои худсарона ҳанӯз ба таври қаноатбахш ҳал карда намешавад. Усулҳои мавҷудаи ҳалли ин мушкилот танҳо барои объектҳои мушаххас, аз қабили объектҳои оддии геометрӣ (масалан, бисёрҳимҳо), чеҳраи одамон, аломатҳои чопшуда ё дастнавис ё воситаҳои нақлиёт ва дар ҳолатҳои мушаххас, ки маъмулан бо истилоҳҳо тавсиф мешаванд, беҳтарин ҳал карда мешаванд. равшании дақиқ муайяншуда, замина ва мавқеи объект нисбат ба камера. Дар адабиёт навъҳои гуногуни мушкилоти шинохтан тавсиф шудаанд:

• Шиносоии объект

Як ё якчанд объектҳо ё синфҳои объектҳои қаблан муайяншуда ё омӯхташуда метавонанд эътироф карда шаванд, одатан дар якҷоягӣ бо мавқеъҳои 2D дар тасвир ё мавқеъҳои 3D дар саҳна.

• Муайянкунӣ
Намунаи инфиродии объект эътироф карда мешавад. Намунаҳо муайян кардани чеҳраи шахси мушаххас ё изи ангушт ё мушаххас кардани мошини мушаххас мебошанд.

• Муайянкунӣ
Маълумоти тасвирӣ барои як ҳолати мушаххас скан карда мешавад. Намунаҳо ошкор кардани ҳуҷайраҳо ё бофтаҳои эҳтимолии ғайримуқаррарӣ дар тасвирҳои тиббӣ ё муайян кардани мошин дар системаи автоматии пулакӣ мебошанд. Муайянкуние, ки дар асоси ҳисобкуниҳои нисбатан содда ва зуд асос ёфтааст, баъзан барои дарёфти минтақаҳои хурдтари маълумоти ҷолиби тасвир истифода мешавад, ки онҳоро метавон минбаъд тавассути усулҳои бештар аз ҷиҳати ҳисоббарорӣ барои тавлиди тафсири дуруст таҳлил кард.

Якчанд вазифаҳои махсусгардонидашуда дар асоси эътироф мавҷуданд, ба монанди:

• Ҷустуҷӯи тасвир дар асоси мундариҷа
Дар ин ҷо ҳама тасвирҳо дар маҷмӯи васеътари тасвирҳо пайдо мешаванд, ки мундариҷаи мушаххас доранд. Мундариҷаро бо роҳҳои гуногун метавон муайян кард, масалан аз рӯи шабоҳати нисбат ба тасвири мавриди ҳадаф (ҳамаи тасвирҳои ба тасвири X монандро ба ман диҳед) ё аз рӯи меъёрҳои ҷустуҷӯии сатҳи баланд, ки ҳамчун вуруди матн дода шудаанд (ҳамаи тасвирҳоеро, ки дар бар мегиранд, ба ман диҳед. хонахои бисьёре, ки дар фасли зимистон гирифта шудаанд ва дар онхо мошин надоранд).

• Баҳодиҳии мавқеъ
мо бояд мавқеъ ё самти объекти мушаххасро нисбат ба камера ҳисоб кунем. Намунаи ариза барои ин техника метавонад кӯмак ба робот барои гирифтани ашё аз тасмаи конвейер дар ҳолати конвейерӣ бошад.

• Шинохтани аломатҳои оптикӣ
OCR ки аломатҳоро дар тасвирҳои матни чопшуда ё дастӣ муайян мекунад, одатан бо мақсади рамзгузории матн дар формати бештар ва имкон додани таҳрир ё индексатсияи шӯъбаи илмҳои компютерӣ ва муҳандисии Донишгоҳи давлатии Мичиган. "Омӯзгорони Лабораторияи Шинохтани Намунаҳо ва коркарди тасвир (PRIP) ва донишҷӯён истифодаи мошинҳоро барои шинохтани намунаҳо ё ашёҳо таҳқиқ мекунанд. Усулҳо барои ҳис кардани объектҳо, муайян кардани кадоме аз хусусиятҳои онҳо аз дигарон фарқ кардан ва тарҳрезии алгоритмҳое таҳия карда мешаванд, ки онҳоро мошин барои тасниф кардан истифода бурда метавонад. Ба замимаҳои муҳим шинохти чеҳра, шиносоии изи ангушт, таҳлили тасвири ҳуҷҷат, сохтани модели объекти 3D, паймоиши робот ва визуализатсия/таҳқиқи маълумоти ҳаҷмии 3D дохил мешаванд. Мушкилоти муосири тадқиқот аз тасдиқи биометрӣ, назорат ва пайгирии автоматӣ, HCI-и бесим, моделсозии чеҳра, аломатгузории рақамии обӣ ва таҳлили сохтори ҳуҷҷатҳои онлайн иборатанд. Хатмкардагони охирини лаборатория дар бораи шинохти дастнавис, тафтиши имзо, омӯзиши визуалӣ ва ҷустуҷӯи тасвир кор кардаанд.”

⦁ Шинохти чеҳра
мо медонем, ки системаҳои шинохти чеҳра тадриҷан ҳамчун воситаи истихроҷи иттилооти биометрӣ маъмул мешаванд. Шинохти чеҳра дар системаҳои биометрӣ нақши муҳим дорад ва барои барномаҳои сершумор, аз ҷумла назорати визуалӣ ва амният ҷолиб аст. Аз сабаби қабули оммавии тасвирҳои чеҳра дар ҳуҷҷатҳои гуногун, шинохти чеҳра дорои потенсиали бузургест, ки ба технологияи насли ояндаи биометрии интихоб табдил ёбад.

Системаҳои шинохти тасвирҳо

⦁ Таҳлили ҳаракат
Якчанд вазифаҳо ба баҳодиҳии ҳаракат марбутанд, ки дар он пайдарпаии тасвир коркард карда мешавад, то баҳодиҳии суръат ё дар ҳар як нуқтаи тасвир ё саҳнаи 3D ё ҳатто камерае, ки тасвирҳоро тавлид мекунад. Намунаҳои чунин вазифаҳо инҳоянд:

⦁  Ҳаракати ego
Муайян кардани ҳаракати сахти 3D (гардон ва тарҷумаи) камера аз пайдарпаии тасвири аз ҷониби камера истеҳсолшуда.

⦁ пайгирӣ
Пайгирӣ аз паи ҳаракатҳои маҷмӯи хурдтари (одатан) нуқтаҳои таваҷҷӯҳ ё объектҳо (масалан, мошинҳо ё одамон) дар пайдарпаии тасвир мебошад.

⦁ Ҷараёни оптикӣ
Ин барои муайян кардани ҳар як нуқтаи тасвир аст, ки чӣ гуна ин нуқта нисбат ба ҳамвории тасвир ҳаракат мекунад, яъне ҳаракати зоҳирии он. Ин ҳаракат натиҷаи ҳам аз он аст, ки нуқтаи мувофиқи 3D дар саҳна чӣ гуна ҳаракат мекунад ва камера нисбат ба саҳна чӣ гуна ҳаракат мекунад.

⦁ Таҷдиди саҳна
Бо назардошти як ё (одатан) бештари тасвирҳои саҳна ё видео, таҷдиди саҳна ба ҳисоб кардани модели 3D-и саҳна нигаронида шудааст. Дар соддатарин ҳолат модел метавонад маҷмӯи нуқтаҳои 3D бошад. Усулҳои мураккабтар модели мукаммали сатҳи 3D истеҳсол мекунанд

⦁ Барқарорсозии тасвир
Ҳадафи барқарорсозии тасвир бартараф кардани садо (садои сенсор, норавшании ҳаракат ва ғ.) аз тасвирҳо мебошад. Усули соддатарин барои бартараф кардани садо намудҳои гуногуни филтрҳо ба монанди филтрҳои пастгузар ё филтрҳои медиан мебошанд. Усулҳои мураккабтар моделеро дар назар доранд, ки сохторҳои тасвирии маҳаллӣ чӣ гуна ба назар мерасанд, моделе, ки онҳоро аз садо фарқ мекунад. Аввалан тавассути таҳлили маълумоти тасвирӣ аз рӯи сохторҳои тасвирии маҳаллӣ, аз қабили хатҳо ё кунҷҳо ва сипас назорат кардани филтр дар асоси маълумоти маҳаллӣ аз марҳилаи таҳлил, одатан дар муқоиса бо равишҳои соддатар сатҳи беҳтари бартараф кардани садо ба даст оварда мешавад. Мисол дар ин соҳа расми онҳост. Баъзе системаҳо барномаҳои алоҳидае мебошанд, ки мушкилоти муайяни андозагирӣ ё муайянкуниро ҳал мекунанд, дар ҳоле ки дигарон зерсистемаи тарҳи калонтарро ташкил медиҳанд, ки масалан, инчунин зерсистемаҳои назорати механизмҳои механикӣ, банақшагирӣ, пойгоҳи додаҳои иттилоотӣ, инсонро дар бар мегиранд. интерфейсҳои мошин ва ғайра. Татбиқи мушаххаси системаи биниши компютерӣ инчунин аз он вобаста аст, ки оё функсияи он пешакӣ муайян карда шудааст ё оё баъзе қисми онро ҳангоми кор омӯхтан ё тағир додан мумкин аст. Аммо, функсияҳои маъмулӣ мавҷуданд, ки дар бисёре аз системаҳои биниши компютерӣ мавҷуданд.

 

Омӯзиши амиқтар бо шинохти тасвир

Шинохти тасвир пеш аз AI буд. Бо вуҷуди ин, омили омӯзиши мошинсозӣ усулҳои инқилоб барои муайян кардани чеҳраи ашё ё шахс аст. Омӯзиши мошинҳо танҳо вақте самаранок аст, ки маълумот барои ғизо додани он мавҷуд бошад. Барои ҳама автоматизатсияи AI, супориш додани он барои муайян кардани тасвирҳо як дархости оддӣ нест. Фаҳмиши мо дар бораи визуалӣ табиати дуюм аст; он чизест, ки мо аз синни ҷавонӣ барномарезӣ кардаем. Аз як мошин пурсидан кори осон нест. Аз ин сабаб, яке аз шаклҳои маъмултарини шинохти AI шабакаҳои нейронҳои конволютсионӣ (CNN) мебошад. CNN усулест, ки ба пикселҳои дар паҳлӯи ҳамдигар ҷойгиршуда тамаркуз мекунад. Тасвирҳои ба ҳам наздик ҷойгиршуда эҳтимоли бештар алоқаманданд, ки ин маънои онро дорад, ки объект ё чеҳра ба расм бо шаффофияти бештар мувофиқат мекунад.
Дар ҳоле ки брендҳое, ки мехоҳанд васоити ахбори иҷтимоӣ пул кор кунанд, гарчанде ки шинохти тасвири AI манфиатҳои равшан дорад, ҳолатҳои истифодаи он хеле амиқтаранд. Мошинҳои худидоракунанда чизи навбатии бузургтарин дар ҷаҳони автомобилӣ хоҳанд шуд ва технологияи шинохти тасвири AI барои қувват додани онҳо кӯмак мекунад. Мошини худгард, ки метавонад ашё ва одамонро дар роҳ муайян кунад, то ба онҳо бархӯрда нашавад. Он бояд тасвирҳоро эътироф кунад, то қарорҳои оқилона қабул кунад. Ҳар як мошини худгард бо якчанд сенсорҳо муҷаҳҳаз карда шудааст, то он метавонад дигар мошинҳои ҳаракаткунанда, велосипедронҳо ва одамонро муайян кунад - асосан ҳама чизеро, ки метавонад хатар эҷод кунад. Мошини автоматӣ бояд хатарҳои роҳро ҳамон тавре, ки ронандаи ботаҷриба кор мекунад, коркард кунад. Пеш аз он ки мошинҳои худгард дар соли 2020 ба роҳ бароянд, ҳанӯз чанд ҷанбаҳоро ҳал кардан лозим аст. Аммо вақте ки автоматизатсияи воситаҳои нақлиёт ба кор медарояд, шинохти тасвири AI яке аз ронандагони асосии бехатарии онҳо хоҳад буд.
⦁ Гирифтани тасвир
Тасвири рақамӣ аз ҷониби як ё якчанд сенсорҳои тасвирӣ истеҳсол карда мешавад, ки ба ғайр аз намудҳои гуногуни камераҳои ба рӯшноӣ ҳассос, сенсорҳои диапазон, дастгоҳҳои томографӣ, радарҳо, камераҳои ултра садоӣ ва ғайраро дар бар мегиранд. Вобаста ба намуди сенсор, маълумоти тасвирии натиҷавӣ тасвири оддии 2D, ҳаҷми 3D ё пайдарпаии тасвир аст. Қиматҳои пиксел одатан ба шиддатнокии рӯшноӣ дар як ё якчанд бандҳои спектрӣ (тасвирҳои хокистарӣ ё тасвирҳои ранга) мувофиқат мекунанд, аммо инчунин метавонанд бо ченакҳои гуногуни ҷисмонӣ, ба монанди амиқ, азхудкунӣ ё инъикоси мавҷҳои садоӣ ё электромагнитӣ ё резонанси магнитии ядроӣ алоқаманд бошанд.
⦁ коркарди пешакӣ:
Пеш аз он ки усули биниши компютерӣ ба додаҳои тасвирӣ барои истихроҷи ягон пораи мушаххаси иттилоот татбиқ карда шавад, одатан коркарди маълумот лозим аст, то боварӣ ҳосил кунем, ки он ба пиндоштҳои муайяне, ки ин усул пешбинӣ шудааст, қонеъ мекунад. Мисолхо
1. Аз нав интихоб кунед, то боварӣ ҳосил кунед, ки системаи координатаҳои тасвир дуруст аст.
2. Паст кардани садо бо мақсади кафолат додани он, ки садои сенсор маълумоти бардурӯғ ворид намекунад.
3. Такмили контраст барои боварӣ ҳосил кардан мумкин аст, ки иттилооти мувофиқро ошкор кардан мумкин аст.
4. Намоиши миқёс-фазо барои такмил додани сохторҳои тасвир дар миқёсҳои мувофиқи маҳаллӣ.
⦁ истихроҷи хусусият:
Хусусиятҳои тасвир дар сатҳҳои гуногуни мураккабӣ аз маълумоти тасвир гирифта мешаванд. Намунаҳои хоси чунин хусусиятҳо хатҳо, кунҷҳо ва пуштаҳо мебошанд
Нуқтаҳои таваҷҷӯҳи маҳаллӣ, аз қабили кунҷҳо, блокҳо ё нуқтаҳо. Хусусиятҳои мураккабтар метавонанд бо матн, шакл ё ҳаракат алоқаманд бошанд.
⦁ Муайянкунӣ/сегментатсия:
Дар баъзе лаҳзаҳои коркард қарор қабул карда мешавад, ки кадом нуқтаҳо ё минтақаҳои тасвир барои коркарди минбаъда мувофиқанд. Мисолхо
1. Интихоби маҷмӯи мушаххаси нуқтаҳои таваҷҷӯҳ
2. Сегментатсияи як ё якчанд минтақаҳои тасвир, ки дорои объекти мушаххаси таваҷҷӯҳ мебошанд.
⦁ Коркарди сатҳи баланд:
Дар ин марҳила, вуруд маъмулан маҷмӯи хурди додаҳо мебошад, масалан маҷмӯи нуқтаҳо ё минтақаи аниматсионӣ, ки тахминан объекти мушаххасро дар бар мегирад. Коркарди боқимонда, масалан, бо:
1. Тасдиқи он, ки маълумот ба фарзияҳои мушаххаси модел ва барнома мувофиқат мекунад.
2. Арзёбии параметрҳои мушаххаси барнома, ба монанди мавқеи объект ё андозаи объект.
3. Тасниф кардани объекти ошкоршуда ба категорияҳои гуногун. Ҳамин тавр, коркарди тасвир ба AI дар муайян кардани тасвир ва посух додан ба муайянкунии тасвир кӯмак мекунад.

Ояндаи бефосилаи тасвирҳо

Бо беҳтар шудани технология, шинохти тасвир натиҷаҳои боз ҳам бештарро бармегардонад. Сардори шӯъбаи омӯзиши мошинсозӣ дар Lobster Владимир Павлов мегӯяд, "Асосҳои математикии шинохти объектҳо муддати тӯлонӣ вуҷуд дошт, аммо имкониятҳои технологии истифодаи алгоритмҳои биниши компютерӣ ба наздикӣ пайдо шуданд. Аллакай, шабакаҳои нейрон имкон медиҳанд, ки детекторҳои мукаммалеро созанд, ки қодиранд аз одамон беҳтар кор кунанд. Як ҷаҳиши калон мавҷудияти маҷмӯаҳои тасвирии қайдшударо барои омӯзиш нигоҳ медорад, аммо дар ояндаи наздик ин мушкилот нахоҳад буд. Муҳандисони биниши компютерӣ дар болои алгоритмҳои худомӯзӣ фаъолона кор мекунанд.” Бо ояндае, ки муоширати визуалӣ ба таври ҷиддӣ таъсир мерасонад, шинохти тасвир омили калидӣ дар паси бисёре аз тасвирҳои мо хоҳад буд. Ҳам дар ҳаёти воқеӣ ва ҳам онлайн.