Nega tasvirni aniqlash muhim?

Internetdagi moddalarning taxminan 80% ingl. Siz allaqachon rasm yorlig'i nima uchun moddalar jadvalining hukmdori sifatida o'z o'rnini egallashi mumkinligini tushunishni boshlashingiz mumkin. Odamlar yoki tashkilotlar bo'lishidan qat'i nazar, sun'iy intellekt yordamida tasvirni tanib olish onlayn tasvirlarni ahamiyatsiz ob'ekt bilan ajratib ko'rsatish imkonini berdi. Har yili 657 milliardga yaqin fotosuratlar diqqat bilan joylashtiriladi, ularning katta qismi onlayn media orqali namoyish etiladi. Ushbu rasmlarning munosib qismi, ular tasodifiy qilyaptimi yoki yo'qmi, ob'ektlarni ilgari surayotgan shaxslardir. Mijoz tomonidan ishlab chiqarilgan kontent (UGC) o'zining eng mukammal tuzilishida brendlar uchun ajoyib kuchaytiruvchi ta'sir ko'rsatadi, chunki u eng ideal rivojlanish turini beradi.

Onlayn ommaviy axborot vositalari orqali xaridor xabari bo'lganda, tashkilotlarni ogohlantiruvchi reklama qurilmalari mavjud, ammo ijtimoiy postda hech kim o'z nomini belgilamasdan brendlar rivojlanishi haqida biror narsa aytish kerak emasmi? Bu sun'iy intellekt tasvirini tanib olish o'z qiymatini ko'rsatadigan joy. Agar texnologiya to'g'ri ma'lumotlar to'plamiga g'amxo'rlik qilsa, AI tasvirni aniq yorliqsiz ajrata oladi. Natijalar brendlar uchun ijtimoiy ogohlantirishlarni kuzatish va ularga rioya qilishlari uchun muhimdir.

Tasvirni aniqlash qanday ishlaydi?

Bizga ma'lumki, AI fotosuratlarni qidirish va ularni keng ma'lumot to'plamlari bilan taqqoslash uchun veb-asoslangan media bosqichlarini ko'rib chiqishi mumkin. O'sha paytda u odamlar qila oladigan darajadan tezroq mos keladigan tegishli rasmni tanlaydi. Brendlar veb-ga asoslangan media orqali o'ziga o'xshash kontentni topish uchun rasmni tasdiqlashdan foydalanadi. Bu brendning logotipini ajratib ko'rsatishni yoki veb-mijozlarga asoslangan media mijozlari orasida tabiiy ravishda joylashtirilgan element holatini idrok etishni nazarda tutadi. Odamlardan bunday ko'p ma'lumotlar orqali baliq ovlashni so'rash charchaydi. Simulyatsiya qilingan intellekt insonning qo'pol xatosini ta'kidlamaydi va aniq natijalarni tengsiz darajada qaytaradi. Sun'iy intellekt rasmini tan olish matni talab qilmasdan, shaxslar brend haqida nima deyishlarini ekranga chiqaradi. Tashkilot nomini yozishni kutmagan mijozlar o'zlarining ijtimoiy ogohlantirishlariga amal qilishga tayyor brendlar bebaho mavqega ega bo'ladi. O'zlarining onlayn inklyuziyasidan faqat AI tomonidan qabul qilingan identifikatorlar orqali foydalanish imkoniyati juda katta va tengsiz inklyuziyani taklif qiladi.

Tasvirni tanib olishning ba'zi oddiy vazifalari:

Avvaliga rasm ma'lumotlarida biron bir maqola, ta'kidlash yoki harakat bor-yo'qligini aniqlashimiz kerak. Ushbu topshiriq odatda odam tomonidan chin dildan va kuch sarflamasdan hal qilinishi mumkin, ammo umumiy holat uchun kompyuterni ko'rishda hali etarli darajada hal etilmagan: ixtiyoriy holatlarda o'z-o'zini tasdiqlovchi maqolalar. Ushbu muammoni hal qilishning hozirgi usullari aniq maqolalar, masalan, asosiy matematik elementlar (masalan, ko'p yuzli), inson yuzlari, bosilgan yoki transkripsiya qilingan belgilar yoki transport vositalari uchun eng yaxshi tarzda hal qilinishi mumkin va aniq holatlarda, odatda, hamma uchun tasvirlangan. kamera bilan solishtirganda ob'ektning xarakterli yorqinligi, poydevori va holati atrofida. Yozuvda e'tirof etish masalasining turli xil assortimentlari tasvirlangan:

• Obyektni tanib olish

Bir yoki bir nechta oldindan aniqlangan yoki o'rganilgan maqolalar yoki ob'ektlar sinflari, odatda, ularning rasmdagi 2D holatlari yoki sahnadagi 3D pozitsiyalari bilan birga idrok etilishi mumkin.

• Identifikatsiya

Maqolaning individual holati idrok etiladi. Modellar ma'lum bir shaxsning yuzini yoki noyob belgisini yoki ma'lum bir transport vositasining identifikatorini ajratib turuvchi dalildir.

• Aniqlash

Rasm ma'lumotlari ma'lum bir holat uchun tekshiriladi. Modellar - bu klinik rasmlarda g'alati hujayralar yoki to'qimalarning topilishi yoki dasturlashtirilgan ko'cha xarajatlari doirasida transport vositasining tan olinishi. O'rtacha sodda va tez hisob-kitoblarga bog'liq bo'lgan kashfiyot bu erda va u erda qiziqarli rasm ma'lumotlarining oddiyroq qismlarini topish uchun ishlatiladi, ularni qo'shimcha ravishda to'g'ri tarjimani yaratish uchun ko'proq hisoblash strategiyalari orqali ajratish mumkin.

E'tirofga bog'liq bo'lgan bir nechta maxsus tashabbuslar mavjud, masalan,

• Kontentga asoslangan rasmni tiklash

Bu erda barcha rasmlar ma'lum bir moddaga ega bo'lgan rasmlarning kattaroq tartibida topiladi. Moddani kutilmagan tarzda aniqlash mumkin, masalan, ob'ektiv rasmga nisbatan o'xshashlik (menga X rasmi kabi barcha rasmlarni bering) yoki matn kiritish sifatida berilgan muhim darajadagi izlanish standartlari (menga ko'p sonli rasmlarni o'z ichiga olgan barcha rasmlarni bering) uylar, qishda olinadi va ularda transport vositalari yo'q).

• Pozni baholash

kamera bilan solishtirganda ma'lum bir maqolaning o'rnini yoki yo'nalishini o'lchashimiz kerak. Ushbu strategiyaning namunaviy ilovasi robotga mexanik ishlab chiqarish tizimi sharoitida transport liniyasidan narsalarni tiklashga yordam beradi.

• Optik belgilarni tasdiqlash

OCR bosma yoki qo'lda yozilgan kontent rasmlaridagi belgilarni ajratib turadi, ko'pincha tashkilotdagi tarkibni ko'proq kodlash va Michigan shtat universitetining Kompyuter fanlari va muhandislik bo'limiga o'zgartirish yoki buyurtma berish imkoniyatini beradi. Strategiyalar ob'ektlarni aniqlash, ularning qaysi biri ularni boshqalardan tanib olishini topish va tavsiflash uchun mashina tomonidan ishlatilishi mumkin bo'lgan hisob-kitoblarni rejalashtirish uchun yaratilgan. Muhim ilovalar yuzni tan olish, barmoq taassurotlarini aniqlash mumkin bo'lgan isbot, rekord rasmni tekshirish, 3D maqola modelini ishlab chiqish, robot marshruti va 3D hajmli ma'lumotlarni taqdim etish/tekshirishni o'z ichiga oladi. Ebb va oqim tadqiqot masalalari biometrik tasdiqlash, dasturlashtirilgan kuzatish va kuzatish, qo'lsiz HCI, yuzni ko'rsatish, kompyuterlashtirilgan suv belgilari va onlayn arxivlarning dizaynini o'z ichiga oladi. Laboratoriyaning kechki bitiruvchilari qalamni tan olish, imzolarni tekshirish, vizual o'rganish va rasmni tiklash bilan shug'ullangan.

Model:

Rasm mavzusini tanib olish imkoniyatiga ega bo'lish uchun hayratlanarli darajada bir necha pikselli ma'lumotlar kerakligini ko'rishimiz kerak, MIT mutaxassisi boshqargan guruh. Vahiy onlayn suratlarni mexanizatsiyalashgan taniqli isbotlashda g'ayrioddiy yutuqlarga olib kelishi mumkin va nihoyat, shaxsiy kompyuterlarga odamlar kabi ko'rish uchun zamin yaratishi mumkin. Ayniqsa, qisqa tasvirni xulosa qilish, natijada Internetdagi milliardlab rasmlarni inventarizatsiya qilish uchun muhim muvaffaqiyat bo'ladi. Hozirda rasmlarni qidirishning yagona yondashuvlari har bir rasm uchun shaxslar qo'lda kiritgan kontent yozuvlariga bog'liq va ko'plab rasmlar bunday ma'lumotlarga muhtoj. Dasturlashtirilgan identifikator ham odamlarga kompyuterlashtirilgan kameralardan shaxsiy kompyuterlariga yuklab olingan rasmlarni fayllarni boshdan kechirmasdan va qo'lda subtitrlarsiz yuklab olish imkonini beradi. Bundan tashqari, oxir-oqibat, bu robotlarga o'z kameralaridan keladigan ma'lumotlarni saralash va ularning qaerdaligini aniqlash imkonini beradigan haqiqiy mashina ko'rishni talab qilishi mumkin. Shunday qilib, agar ikkita rasm [raqamlar] taqqoslanadigan guruhga ega bo'lsa, ular qiyosiy bo'lishi mumkin. odatda o'xshash maqoladan, odatda o'xshash tartibga solishdan iborat." Agar bitta rasm yozuv yoki sarlavha bilan bog'liq bo'lsa, o'sha paytda uning matematik kodini muvofiqlashtiradigan turli xil rasmlar, ehtimol, shunga o'xshash ob'ektni (masalan, transport vositasi, daraxt yoki shaxs) ko'rsatishi mumkin, shuning uchun bitta rasmga tegishli nom bo'lishi mumkin. boshqalarga o'tdi. "Juda ko'p rasmlar bilan, hatto oddiy hisob-kitoblar ham rasmlarni tanib olishda juda yaxshi ishlashi mumkin".

⦁ Yuzni tanish

Biz yuzni tan olish tizimi biometrik ma'lumotlarni o'chirish usullari sifatida doimiy ravishda mashhur bo'lib borayotganini tushunamiz. Yuzni tan olish biometrik tizimlarda asosiy qismga ega va turli xil ilovalar, jumladan vizual razvedka va xavfsizlik uchun jozibador. Turli hisobotlarda yuz rasmlarini umumiy tan olish nuqtai nazaridan, yuzni tan olish qarorning eng zamonaviy biometrik innovatsiyasiga aylanish uchun ajoyib salohiyatga ega.

Rasmni aniqlash tizimlari

⦁ Harakat tekshiruvi

Bir nechta topshiriqlar harakatni baholash bilan belgilanadi, bu erda rasmdagi har bir fokusda yoki 3D-sahnada yoki hatto rasmlarni etkazib beradigan kamerada tezlik o'lchovini yaratish uchun rasm ketma-ketligi tayyorlanadi. Bunday topshiriqlarning misollari:

⦁ Ego harakati

Kamera tomonidan yaratilgan rasm ketma-ketligidan kameraning 3D moslashuvchan harakatini (burilish va talqin) aniqlash.

⦁ Kuzatuv

Quyida rasm ketma-ketligidagi qiziqish markazlari yoki noroziliklarning (masalan, transport vositalari yoki odamlar) (umuman) oddiyroq tartibidagi o'zgarishlar kuzatiladi.

⦁ Optik oqim

Bu rasmning har bir nuqtasi uchun bu nuqta rasm tekisligiga nisbatan qanday harakat qilishini, ya'ni uning aniq harakatini aniqlashdir. Bu harakat 3D nuqtaning sahnada qanday harakatlanishi va kameraning sahnaga nisbatan qanday harakatlanishi natijasidir.

⦁ Sahnani qayta ishlash

Sahnaning bir yoki (odatda) bir nechta rasmi yoki videoni hisobga olsak, sahnani reproduktsiya qilish sahnaning 3D modelini ro'yxatga oladi. Eng oson holatda model 3D fokuslar to'plami bo'lishi mumkin. Yana takomillashtirilgan strategiyalar jami 3D sirt modelini ishlab chiqaradi

⦁ Tasvirni qayta tiklash

Tasvirni qayta tiklashning maqsadi rasmlardan g'alayonni (datchik shovqini, harakatning noaniqligi va boshqalar) evakuatsiya qilishdir. G'alayonni chiqarib yuborishning eng kam murakkab usuli - bu turli xil kanallar, masalan, past o'tkazuvchan kanallar yoki o'rta kanallar. Ko'proq zamonaviy strategiyalar qo'shni rasm tuzilmalari qanday o'xshashligi modelini, ularni g'alayondan tanib oladigan modelni kutadi. Dastlab rasm ma'lumotlarini yaqin atrofdagi rasm tuzilmalarida, masalan, chiziqlar yoki qirralarda o'rganib chiqish va keyin qo'shni ma'lumotlarga bog'liqlikni tekshirish bosqichidan ajratishni nazorat qilish orqali, odatda, shovqinni evakuatsiya qilishning yuqori darajasi kamroq bo'lganidan farq qiladi. murakkab metodologiyalar. Bu sohadagi namuna ularning rasmidir. Ba'zi ramkalar ma'lum bir baholash yoki tan olish masalasini hal qiladigan mustaqil ilovalardir, boshqalari esa, masalan, mexanik aktuatorlarni boshqarish, tartibga solish, ma'lumotlar bazalari, ma'lumotlar bazasini boshqarish uchun kichik ramkalarni o'z ichiga olgan kattaroq rejaning kichik tartibini o'z ichiga oladi. Mashina interfeyslari va boshqalar. Shaxsiy kompyuterni ko'rish ramkasining o'ziga xos ishlashi, shuningdek, uning foydaliligi oldindan belgilab qo'yilgan bo'lsa yoki uning biron bir qismi faoliyat davomida juda yaxshi o'rganilishi yoki moslashtirilishi mumkinligiga bog'liq. Qanday bo'lmasin, ko'p sonli shaxsiy kompyuter ko'rishda uchraydigan muntazam imkoniyatlar mavjud