De ce este importantă recunoașterea imaginii?

Aproximativ 80% din substanța de pe web este vizuală. Ai putea deja să începi să știi de ce etichetarea imaginilor își poate păstra locul ca stăpân al tabelului de substanțe. Indiferent dacă este vorba despre oameni sau organizații, recunoașterea imaginii AI a făcut posibilă distingerea imaginilor online cu obiecte nesemnificative. În jur de 657 de miliarde de fotografii sunt postate în fiecare an cu atenție, cea mai mare parte fiind afișată prin media online. O parte decentă din acele imagini sunt indivizi care avansează articole, indiferent dacă o fac accidental. Conținutul produs de clienți (UGC) în structura sa cea mai perfectă este o influență strălucitoare de putere pentru mărci, deoarece oferă cel mai ideal tip de avansare.

Există dispozitive de publicitate pentru a alarma organizațiile atunci când există o notificare a cumpărătorului prin intermediul mass-media online, totuși, nu ar trebui să se spună ceva despre când se întâmplă progresul mărcilor fără ca cineva să-și eticheteze numele în postarea socială? Acesta este locul în care recunoașterea imaginii AI își demonstrează valoarea. În cazul în care tehnologia este îngrijită de seturile de date potrivite, AI poate distinge o imagine fără o etichetă explicită la care se face referire. Rezultatele sunt importante pentru mărci să urmărească și să urmărească notificările sociale.

Cum funcționează recunoașterea imaginii?

După cum probabil știm, AI poate căuta prin etapele media bazate pe web căutând fotografii și le poate contrasta cu colecții de informații largi. În acel moment, alege o imagine pertinentă care se potrivește la un ritm mult mai rapid decât sunt capabili să o facă oamenii. Mărcile folosesc recunoașterea imaginilor pentru a descoperi conținut ca al lor prin intermediul media bazate pe web. Aceasta implică distincția logo-ului unei mărci sau perceperea situației elementului poziționat în mod natural în rândul clienților media bazați pe web. A cere oamenilor să pescuiască atât de multe date devine efectiv obositor. Inteligența simulată nu pune accent pe gafa umană și returnează rezultate exacte la niveluri de neegalat. Recunoașterea imaginii prin inteligență artificială evidențiază ceea ce indivizii spun despre o marcă fără a fi nevoie de text. Mărcile gata să-și urmeze notificările sociale fără ca clienții să se aștepte să introducă numele organizației vor ajunge într-o poziție neprețuită. Posibilitatea de a profita de propria includere online exclusiv prin identificatori percepuți de AI este imensă și oferă o includere de neegalat.

Iată câteva sarcini obișnuite de recunoaștere a imaginii: -

De la început, trebuie să decidem dacă informațiile despre imagine conține un anumit articol, evidențiere sau mișcare. Această sarcină poate fi de obicei abordată din inimă și fără efort de către un om, dar încă nu este abordată suficient în viziunea PC pentru cazul general: articole auto-asertive în circumstanțe discreționare. Tehnicile actuale de gestionare a acestei probleme pot fi abordate cel mai bine doar pentru articole explicite, de exemplu, articole matematice de bază (de exemplu, poliedrice), fețe umane, caractere tipărite sau transcrise sau vehicule și, în circumstanțe explicite, în mod obișnuit descrise în măsura în care toate în jurul strălucirii caracterizate, fundația și postura articolului comparativ cu camera. În scris sunt prezentate diverse sortimente ale problemei de recunoaștere:

• Recunoașterea obiectelor

Pot fi percepute unul sau câteva articole sau clase de articole predeterminate sau învățate, în mod normal împreună cu situațiile lor 2D din imagine sau posturile 3D din scenă.

• Identificare

Se percepe un caz individual al unui articol. Modelele sunt dovezi distinctive ale feței unei anumite persoane sau ale mărcii unice sau ale ID-ului unui anumit vehicul.

• Detectare

Informațiile din imagine sunt examinate pentru o anumită condiție. Modelele sunt descoperirea de celule sau țesuturi ciudate imaginabile în imagini clinice sau recunoașterea unui vehicul într-un cadru programat de costuri stradale. Descoperirea dependentă de calcule relativ simple și rapide este folosită ici și colo pentru a găsi zone mai modeste de informații de imagine interesante care pot fi defalcate în plus prin strategii de solicitare mai calculatoare pentru a crea o traducere corectă.

Există câteva întreprinderi specifice care depind de recunoaștere, de exemplu,

• Recuperare imagini bazată pe conținut

Aici descoperim toate imaginile într-un aranjament mai mare de imagini care au o anumită substanță. Substanța poate fi determinată într-un mod neașteptat, de exemplu în ceea ce privește similitudinea față de o imagine obiectivă (dați-mi toate imaginile ca imaginea X), sau în măsura în care standardele de urmărire la nivel semnificativ date ca introducere de text (dați-mi toate imaginile care conțin numeroase case, sunt luate în timpul iernii și nu au vehicule în ele).

• Evaluarea pozitiei

trebuie să măsurăm poziția sau direcția unui anumit articol comparativ cu camera. O aplicație model pentru această strategie ar ajuta un robot să recupereze articole de pe o linie de transport într-un sistem de producție mecanic.

• Confirmare optică a caracterelor

OCR care diferențiază caracterele din imaginile conținutului tipărit sau scris manual, în cea mai mare parte cu scopul final de a codifica mai mult conținutul într-o organizație și de a permite modificarea sau comanda Departamentului de Științe și Inginerie Calculatoare, Universitatea de Stat din Michigan. Sunt create strategii pentru a detecta obiectele, pentru a găsi care dintre elementele lor evidențiate le recunosc de la alții și pentru a planifica calcule care pot fi utilizate de o mașină pentru a face caracterizarea. Aplicațiile semnificative includ recunoașterea feței, dovada de recunoaștere a amprentei digitale, examinarea imaginii de înregistrare, dezvoltarea modelului articolului 3D, traseul robotului și reprezentarea/investigarea informațiilor volumetrice 3D. Problemele de cercetare privind fluxul și refluxul includ confirmarea biometrică, observarea și urmărirea programată, HCI fără mâner, afișarea feței, marcarea computerizată și examinarea designului arhivelor online. Absolvenții întârziați ai laboratorului s-au ocupat de recunoașterea caligrafiei, verificarea semnăturii, învățarea vizuală și recuperarea imaginii.”

Model:

Ar trebui să vedem că este nevoie de câțiva pixeli de date șocant pentru a avea opțiunea de a recunoaște subiectul unei imagini, a descoperit un grup condus de un specialist MIT. Dezvăluirea ar putea provoca progrese extraordinare în dovada mecanizată de recunoaștere a imaginilor online și, în cele din urmă, ar putea oferi computerelor o premisă pentru a vedea așa cum fac oamenii. Deducerea unei portretizări deosebit de scurte ar fi un progres semnificativ pentru a face posibilă inventarierea miliardelor de imagini de pe Internet, în consecință. Începând de acum, abordările singure de a căuta imagini depind de inscripțiile de conținut pe care indivizii le-au introdus manual pentru fiecare imagine și numeroase imagini au nevoie de astfel de date. ID-ul programat ar oferi, de asemenea, o abordare a fișierelor pe care persoanele le descarcă de pe camerele computerizate pe computerele lor, fără a le experimenta și subtitra fiecare manual. De asemenea, în cele din urmă ar putea provoca o viziune automată autentică, care ar putea permite uneori roboților să sorteze informațiile provenite de la camerele lor și să trimită unde se află. astfel încât, dacă două imagini au o grupare comparabilă [de numere], acestea sunt probabil comparative. făcută în general dintr-un articol similar, în general într-un aranjament similar.” Dacă o imagine a fost legată de o inscripție sau un titlu, în acel moment imagini diferite care coordonează codul ei matematic ar arăta probabil un element similar, (de exemplu, un vehicul, un copac sau un individ), astfel încât numele asociat unei imagini poate fi mutat la celelalte. „Cu extrem de multe imagini, chiar și calculele în general simple pot funcționa cu adevărat bine” în recunoașterea imaginilor astfel.

⦁ Recunoașterea facială

ne dăm seama că cadrele de recunoaștere a feței devin în mod continuu celebre ca metode de eliminare a datelor biometrice. Recunoașterea feței are o parte de bază în cadrele biometrice și este atrăgătoare pentru diverse aplicații, inclusiv recunoașterea vizuală și securitate. În lumina recunoașterii populației generale a imaginilor feței din diferite rapoarte, recunoașterea feței are un potențial incredibil de a se transforma în inovația biometrică de ultimă oră a deciziei.

Sisteme de recunoaștere a imaginilor

⦁ Examinarea mișcării

Câteva sarcini se identifică cu evaluarea mișcării în care o succesiune de imagini este pregătită pentru a crea un indicator al vitezei fie la fiecare focalizare din imagine, fie în scena 3D, sau chiar a camerei care livrează imaginile. Exemple de astfel de atribuiri sunt:

⦁ Mișcarea Eului

Decizia mișcării inflexibile 3D (pivot și interpretare) a camerei dintr-o succesiune de imagini creată de cameră.

⦁ Urmărire

În continuare, vor fi urmărite evoluțiile unui aranjament (în general) mai modest de concentrări de interes sau proteste (de exemplu, vehicule sau oameni) în succesiunea imaginii.

⦁ Flux optic

Aceasta este pentru a decide, pentru fiecare punct din imagine, cum se mișcă acel punct comparativ cu planul imaginii, adică mișcarea sa evidentă. Această mișcare este un rezultat atât al modului în care punctul 3D de comparare se mișcă în scenă, cât și al modului în care camera se mișcă comparativ cu scena.

⦁ Refacerea scenei

Având în vedere una sau (de obicei) mai multe imagini ale unei scene sau ale unui videoclip, reproducerea scenei vizează înregistrarea unui model 3D al scenei. În cel mai simplu caz, modelul poate fi o grămadă de focalizări 3D. Strategii mai rafinate produc un model total de suprafață 3D

⦁ Reconstituirea imaginii

Punctul de reconstrucție a imaginii este evacuarea agitației (zgomot senzor, mișcare obscure și așa mai departe) din imagini. Cea mai puțin complexă metodologie imaginabilă pentru expulzarea tumultului este diferitele tipuri de canale, de exemplu, canalele low-pass sau canalele mijlocii. Strategiile mai moderne se așteaptă la un model al modului în care se aseamănă structurile de imagine din cartier, un model care le recunoaște din agitație. Prin investigarea mai întâi a informațiilor din imagine într-o perioadă destul de lungă a structurilor de imagine din apropiere, de exemplu, linii sau margini, și apoi controlând separarea dependentă de datele de vecinătate de la etapa de examinare, un grad superior de evacuare a agitației este, în general, în contrast cu cel mai mic. metodologii complexe. Un model în acest domeniu este pictura lor. Câteva cadre sunt aplicații independente care abordează o anumită problemă de estimare sau recunoaștere, în timp ce altele cuprind o sub-aranjare a unui plan mai mare care, de exemplu, conține, de asemenea, sub-cadre pentru controlul actuatoarelor mecanice, aranjarea, bazele de date de informații, interfețe de mașină și așa mai departe Execuția particulară a unui cadru de viziune pentru PC se bazează, de asemenea, pe dacă utilitatea sa este predeterminată sau dacă o parte din el poate fi învățată sau ajustată foarte bine în timpul activității. Există, oricum ar fi, capacități obișnuite care se găsesc în numeroase viziune pe computer