Waarom beeldherkenning belangrik?

Ongeveer 80 persent van die inhoud op die internet is visueel. Jy kan reeds begin uitwerk hoekom beeldmerking sy plek as koning van die inhoudtabel kan beklee. Of dit nou individue of maatskappye is, KI-beeldherkenning het dit moontlik gemaak om beeldmateriaal aanlyn met minimale ophef te identifiseer. Daar word ongeveer 657 miljard foto's elke jaar digitaal geplaas, met die meerderheid wat op sosiale media verskyn. 'n Goeie deel van daardie beelde is mense wat produkte bevorder, selfs al doen hulle dit onwetend. Gebruikergegenereerde inhoud (UGC) in sy suiwerste vorm is 'n uitstekende instaatsteller vir handelsmerke, aangesien dit die beste soort promosie bied.
Daar is bemarkingsinstrumente om maatskappye te waarsku wanneer daar 'n verbruiker melding op sosiale media is, maar wat van wanneer handelsmerkpromosie plaasvind sonder dat iemand hul naam in die sosiale pos merk? Dit is waar AI-beeldherkenning die waarde daarvan bewys. As die tegnologie die korrekte datastelle gevoer word, kan KI 'n beeld identifiseer sonder spesifieke merkervermeldings. Die resultate is van onskatbare waarde vir handelsmerke om hul sosiale meldings op te spoor en op te spoor.

Hoe werk beeldherkenning?

Soos ons weet, kan KI sosiale media-platforms soek op soek na foto's en dit vergelyk met uitgebreide datastelle. Dit besluit dan op relevante beeld wat ooreenstem teen 'n tempo wat baie vinniger is as waartoe mense in staat is. Handelsmerke gebruik beeldherkenning om inhoud soortgelyk aan hul eie op sosiale media te vind. Dit beteken om 'n handelsmerk se logo te identifiseer of om organies geplaasde produkplasing onder sosialemediagebruikers te erken. Om mense te vra om soveel inligting deur te sleep, word maklik vermoeiend. KI is nie bekommerd oor die menslike fout nie, en lewer presiese resultate op ongeëwenaarde vlakke. KI-beeldherkenning monitor wat mense oor 'n handelsmerk sê sonder dat dit nodig is vir teks. Handelsmerke wat hul sosiale meldings kan opspoor sonder dat gebruikers die maatskappy se naam hoef in te tik, sal hulself in 'n voordelige posisie bevind. Die potensiaal om hul eie aanlyn dekking uitsluitlik deur KI-erkende identifiseerders te benut, is groot en bied ongeëwenaarde dekking.

Hier is 'n paar tipiese take van beeldherkenning:-

Aanvanklik moet ons bepaal of die beelddata 'n spesifieke voorwerp, kenmerk of aktiwiteit bevat of nie. Hierdie taak kan normaalweg robuust en sonder moeite deur 'n mens opgelos word, maar word steeds nie in rekenaarvisie bevredigend opgelos vir die algemene geval: arbitrêre objekte in arbitrêre situasies nie. Die bestaande metodes vir die hantering van hierdie probleem kan die beste opgelos word slegs vir spesifieke voorwerpe, soos eenvoudige meetkundige voorwerpe (bv. veelvlakke), menslike gesigte, gedrukte of handgeskrewe karakters, of voertuie, en in spesifieke situasies, tipies beskryf in terme van goed gedefinieerde beligting, agtergrond en houding van die voorwerp relatief tot die kamera. Verskillende variëteite van die herkenningsprobleem word in die literatuur beskryf:

• Voorwerpherkenning

Een of meer voorafgespesifiseerde of aangeleerde voorwerpe of voorwerpklasse kan herken word, gewoonlik saam met hul 2D-posisies in die beeld of 3D-posisies in die toneel.

• Identifikasie
'n Individuele geval van 'n voorwerp word herken. Voorbeelde is identifikasie van 'n spesifieke persoon se gesig of vingerafdruk, of identifikasie van 'n spesifieke voertuig.

• Opsporing
Die beelddata word vir 'n spesifieke toestand geskandeer. Voorbeelde is opsporing van moontlike abnormale selle of weefsels in mediese beelde of opsporing van 'n voertuig in 'n outomatiese padtolstelsel. Opsporing gebaseer op relatief eenvoudige en vinnige berekeninge word soms gebruik vir die vind van kleiner streke van interessante beelddata wat verder ontleed kan word deur meer berekening veeleisende tegnieke om 'n korrekte interpretasie te produseer.

Daar bestaan ​​verskeie gespesialiseerde take gebaseer op erkenning, soos:

• Inhoud-gebaseerde beeldherwinning
Hier vind u alle beelde in 'n groter stel beelde wat 'n spesifieke inhoud het. Die inhoud kan op verskillende maniere gespesifiseer word, byvoorbeeld in terme van ooreenkoms met betrekking tot 'n teikenbeeld (gee vir my alle beelde soortgelyk aan beeld X), of in terme van hoëvlak soekkriteria gegee as teksinvoer (gee vir my alle beelde wat bevat baie huise, word gedurende die winter geneem en het geen motors in nie).

• Posieringsskatting
ons moet die posisie of oriëntasie van 'n spesifieke voorwerp relatief tot die kamera skat. 'n Voorbeeldtoepassing vir hierdie tegniek sou wees om 'n robot te help om voorwerpe van 'n vervoerband af te haal in 'n monteerlynsituasie.

• Optiese karakter herkenning
OCR wat karakters in beelde van gedrukte of handgeskrewe teks identifiseer, gewoonlik met die doel om die teks in 'n formaat meer te enkodeer en in staat te stel om te redigeer of te indekseer Departement Rekenaarwetenskap en Ingenieurswese, Michigan State University. “Die Patroonherkenning en Beeldverwerking (PRIP) Lab-fakulteit en studente ondersoek die gebruik van masjiene om patrone of voorwerpe te herken. Metodes word ontwikkel om voorwerpe waar te neem, om te ontdek watter van hul kenmerke hulle van ander onderskei, en om algoritmes te ontwerp wat deur 'n masjien gebruik kan word om die klassifikasie te doen. Belangrike toepassings sluit in gesigherkenning, vingerafdruk-identifikasie, dokumentbeeldontleding, 3D-objekmodelkonstruksie, robotnavigasie en visualisering/verkenning van 3D-volumetriese data. Huidige navorsingsprobleme sluit in biometriese verifikasie, outomatiese toesig en opsporing, hanteerlose HCI, gesigmodellering, digitale watermerk en die ontleding van struktuur van aanlyn dokumente. Onlangse gegradueerdes van die laboratorium het gewerk aan handskrifherkenning, handtekeningverifikasie, visuele leer en beeldherwinning.”

⦁ Gesigsherkenning
ons weet dat gesigherkenningstelsels geleidelik gewild word as manier om biometriese inligting te onttrek. Gesigherkenning speel 'n kritieke rol in biometriese stelsels en is aantreklik vir talle toepassings, insluitend visuele toesig en sekuriteit. As gevolg van die algemene aanvaarding van gesigbeelde op verskeie dokumente, het gesigherkenning 'n groot potensiaal om die volgende generasie biometriese tegnologie van keuse te word.

Beeldherkenningstelsels

⦁ Bewegingsanalise
Verskeie take hou verband met bewegingsskatting waar 'n beeldreeks verwerk word om 'n skatting van die snelheid te produseer, hetsy by elke punt in die beeld of in die 3D-toneel, of selfs van die kamera wat die beelde produseer. Voorbeelde van sulke take is:

⦁  Ego beweging
Bepaling van die 3D rigiede beweging (rotasie en translasie) van die kamera uit 'n beeldreeks wat deur die kamera geproduseer word.

⦁ Opsporing
Nasporing is om die bewegings van 'n (gewoonlik) kleiner stel belangstellingspunte of voorwerpe (bv. voertuie of mense) in die beeldreeks te volg.

⦁ Optiese vloei
Dit is om te bepaal, vir elke punt in die beeld, hoe daardie punt beweeg relatief tot die beeldvlak, dit wil sê sy skynbare beweging. Hierdie beweging is 'n gevolg van beide hoe die ooreenstemmende 3D-punt in die toneel beweeg en hoe die kamera relatief tot die toneel beweeg.

⦁ Toneelrekonstruksie
Gegewe een of (tipies) meer beelde van 'n toneel, of 'n video, het toneelrekonstruksie ten doel om 'n 3D-model van die toneel te bereken. In die eenvoudigste geval kan die model 'n stel 3D-punte wees. Meer gesofistikeerde metodes produseer 'n volledige 3D-oppervlakmodel

⦁ Beeld herstel
Die doel van beeldherstel is die verwydering van geraas (sensorgeraas, bewegingsvervaging, ens.) uit beelde. Die eenvoudigste moontlike benadering vir geraasverwydering is verskeie tipes filters soos laagdeurlaatfilters of mediaanfilters. Meer gesofistikeerde metodes veronderstel 'n model van hoe die plaaslike beeldstrukture lyk, 'n model wat hulle van die geraas onderskei. Deur eers die beelddata te analiseer in terme van die plaaslike beeldstrukture, soos lyne of rande, en dan die filtering te beheer op grond van plaaslike inligting vanaf die ontledingstap, word 'n beter vlak van geraasverwydering gewoonlik verkry in vergelyking met die eenvoudiger benaderings. 'n Voorbeeld in hierdie veld is hul skildery. Sommige stelsels is selfstandige toepassings wat 'n spesifieke meet- of opsporingsprobleem oplos, terwyl ander 'n substelsel van 'n groter ontwerp uitmaak wat byvoorbeeld ook substelsels bevat vir die beheer van meganiese aktuators, beplanning, inligtingdatabasisse, mens- masjienkoppelvlakke, ens. Die spesifieke implementering van 'n rekenaarvisiestelsel hang ook daarvan af of sy funksionaliteit vooraf gespesifiseer is of as 'n deel daarvan aangeleer of gewysig kan word tydens werking. Daar is egter tipiese funksies wat in baie rekenaarvisiestelsels aangetref word.

 

Dieper leer met beeldherkenning

Beeldherkenning was voor KI. Tog is die masjienleerfaktor 'n rewolusie van metodes om 'n voorwerp of persoon se gesig te identifiseer. Masjienleer is egter slegs effektief as daar data is om dit te voed. Vir al die outomatisering van KI is dit nie 'n eenvoudige versoek om dit opdrag te gee om beelde te identifiseer nie. Ons begrip van beeldmateriaal is tweede natuur; dis iets wat ons van kleins af geprogrammeer is om te doen. Om dieselfde van 'n masjien te vra, is nie 'n eenvoudige proses nie. Om dié rede is een van die meer gewilde vorme van KI-herkenning konvolusionele neurale netwerke (CNN). CNN is 'n metode wat fokus op pixels wat langs mekaar geleë is. Prente wat naby geleë is, is meer geneig om verwant te wees, wat beteken dat 'n voorwerp of gesig by 'n prent met meer deursigtigheid pas.
Terwyl handelsmerke wat sosiale media wil verdien, alhoewel KI-beeldherkenning duidelike voordele inhou, loop die gebruiksgevalle veel dieper. Selfbesturende motors is op die punt om die volgende groot ding in die motorwêreld te wees, en KI-beeldherkenningstegnologie help om hulle aan te dryf. ’n Selfbestuurmotor wat voorwerpe en mense op die pad kan opspoor sodat dit nie in hulle vasry nie, gebeur nie outomaties nie. Dit moet die beelde herken om ingeligte besluite te neem. Elke selfbesturende motor is toegerus met verskeie sensors sodat dit ander bewegende voertuie, fietsryers, mense kan identifiseer - basies enigiets wat 'n gevaar kan inhou. 'n Outomatiese motor moet die gevare van die pad op dieselfde manier verwerk as 'n ervare bestuurder. Daar is nog 'n paar aspekte om uit te stryk voordat selfbesturende motors in 2020 op die pad kom. Maar wanneer voertuigoutomatisering wel inskop, sal KI-beeldherkenning een van die belangrikste drywers agter hulle wees om veilig te werk.
⦁ Beeld-verkryging
'n Digitale beeld word geproduseer deur een of meer beeldsensors, wat, benewens verskeie tipes ligsensitiewe kameras, afstandsensors, tomografie-toestelle, radar, ultrasoniese kameras, ens. insluit. Afhangende van die tipe sensor, die resulterende beelddata is 'n gewone 2D-beeld, 'n 3D-volume of 'n beeldreeks. Die pixelwaardes stem tipies ooreen met ligintensiteit in een of meer spektrale bande (grys beelde of kleurbeelde), maar kan ook verband hou met verskeie fisiese maatreëls, soos diepte, absorpsie of weerkaatsing van soniese of elektromagnetiese golwe, of kernmagnetiese resonansie.
⦁ Voorverwerking:
Voordat 'n rekenaarvisiemetode op beelddata toegepas kan word om 'n spesifieke stukkie inligting te onttrek, is dit gewoonlik nodig om die data te verwerk om te verseker dat dit voldoen aan sekere aannames wat deur die metode geïmpliseer word. Voorbeelde is
1. Hersteekproefneming om te verseker dat die beeldkoördinaatstelsel korrek is.
2. Geraasvermindering om te verseker dat sensorgeraas nie vals inligting bekendstel nie.
3. Kontrasverbetering om te verseker dat relevante inligting opgespoor kan word.
4. Skaal-ruimte-voorstelling om beeldstrukture op plaaslik toepaslike skale te verbeter.
⦁ Kenmerk onttrekking:
Beeldkenmerke op verskillende vlakke van kompleksiteit word uit die beelddata onttrek. Tipiese voorbeelde van sulke kenmerke is lyne, rande en rante
Gelokaliseerde belangstellingspunte soos hoeke, knoppies of punte. Meer komplekse kenmerke kan verband hou met tekstuur, vorm of beweging.
⦁ Opsporing/segmentering:
Op 'n stadium in die verwerking word 'n besluit geneem oor watter beeldpunte of -streke van die beeld relevant is vir verdere verwerking. Voorbeelde is
1. Seleksie van 'n spesifieke stel belangstellingspunte
2. Segmentering van een of meer beeldstreke wat 'n spesifieke voorwerp van belang bevat.
⦁ Hoëvlakverwerking:
By hierdie stap is die invoer tipies 'n klein stel data, byvoorbeeld 'n stel punte of 'n beeldstreek wat aanvaar word om 'n spesifieke voorwerp te bevat. Die oorblywende verwerking handel byvoorbeeld oor:
1. Verifikasie dat die data aan modelgebaseerde en toepassingspesifieke aannames voldoen.
2. Skatting van toepassingspesifieke parameters, soos objekposisie of voorwerpgrootte.
3. Klassifikasie van 'n bespeurde voorwerp in verskillende kategorieë. Dus, beeldverwerking help KI om die beeld te identifiseer en volgens die beeldidentifikasie te reageer.

'n Naatlose toekoms van beelde

Soos die tegnologie verbeter, sal beeldherkenning selfs groter resultate lewer. Hoof van Masjienleer by Lobster, Vladimir Pavlov sê: “Die wiskundige basis vir objekherkenning bestaan ​​al lank, maar tegnologiese moontlikhede om rekenaarvisiealgoritmes te gebruik het onlangs verskyn. Neurale netwerke laat reeds toe om perfekte detektors te maak wat in staat is om beter as mense te werk. 'n Groot ruk hou die teenwoordigheid van gemerkte beelddatastelle vir opleiding terug, maar in die nabye toekoms sal dit nie 'n probleem wees nie. Rekenaarvisie-ingenieurs werk aktief aan selflerende algoritmes.” Met 'n toekoms wat so sterk deur visuele kommunikasie beïnvloed word, gaan beeldherkenning die sleutelfaktor wees agter baie van die prente wat ons sien. Beide in die werklike lewe en aanlyn.