Wêrom is ôfbyldingsherkenning wichtich?

Sawat 80 prosint fan de ynhâld op ynternet is fisueel. Jo kinne al begjinne út te finen wêrom't ôfbyldingstagging syn plak kin hâlde as kening fan 'e ynhâldtabel. Oft it no partikulieren of bedriuwen binne, AI-ôfbyldingsherkenning hat it mooglik makke om fisuele online te identifisearjen mei minimale drokte. D'r wurde elk jier sawat 657 miljard foto's digitaal pleatst, wêrfan de mearderheid op sosjale media ferskynt. In goed stik fan dy bylden binne minsken dy't produkten befoarderje, sels as se dat ûnbewust dogge. User-generated ynhâld (UGC) yn syn suverste foarm is in poerbêste ynskeakeler foar merken, om't it de bêste soart promoasje leveret.
D'r binne marketingynstruminten om bedriuwen te warskôgjen as d'r in konsumintfermelding is op sosjale media, mar hoe sit it as promoasje fan merken plakfynt sûnder dat ien har namme yn 'e sosjale post tagget? Dit is wêr't AI-ôfbyldingsherkenning syn wearde bewiist. As de tech de juste datasets wurdt fied, kin AI in ôfbylding identifisearje sûnder spesifike tagfermeldings. De resultaten binne fan ûnskatbere wearde foar merken om har sosjale fermeldings te folgjen en te folgjen.

Hoe wurket ôfbyldingsherkenning?

Lykas wy witte kin AI sosjale mediaplatfoarms sykje op syk nei foto's en fergelykje mei wiidweidige datasets. It beslút dan oer relevante ôfbylding dy't oerienkomt mei in taryf folle flugger as minsken yn steat binne. Merken brûke ôfbyldingsherkenning om ynhâld te finen dy't fergelykber is mei har eigen op sosjale media. Dat betsjut it identifisearjen fan it logo fan in merk of it erkennen fan organysk pleatst produkt pleatsing ûnder brûkers fan sosjale media. Minsken freegje om safolle ynformaasje troch te trawljen wurdt maklik wurch. AI makket him gjin soargen oer de minsklike flater, en jout presys resultaten op ongeëvenaarde nivo's. AI-ôfbyldingsherkenning kontrolearret wat minsken sizze oer in merk sûnder de needsaak foar tekst. Merken dy't har sosjale fermeldings kinne folgje sûnder dat brûkers de bedriuwsnamme hoege te typen, sille harsels yn in foardielige posysje fine. It potensjeel om har eigen online dekking allinich te benutten fia AI erkende identifiers is enoarm en biedt ongeëvenaarde dekking.

Hjir binne wat typyske taken fan ôfbyldingsherkenning: -

Earst moatte wy bepale oft de ôfbyldingsgegevens wat spesifike objekt, funksje of aktiviteit befetsje. Dizze taak kin normaal robúst en sûnder muoite oplost wurde troch in minske, mar wurdt yn kompjûterfisy foar it algemiene gefal noch net befredigjend oplost: willekeurige objekten yn willekeurige situaasjes. De besteande metoaden foar it omgean mei dit probleem kinne it bêste allinich oplost wurde foar spesifike objekten, lykas ienfâldige geometryske objekten (bgl fan goed definieare ferljochting, eftergrûn en pose fan it objekt relatyf oan de kamera. Ferskillende farianten fan it erkenningsprobleem wurde beskreaun yn 'e literatuer:

• Objekt erkenning

Ien of meardere foarôf oantsjutte of learde objekten as objektklassen kinne wurde werkend, meastentiids tegearre mei har 2D-posysjes yn 'e ôfbylding of 3D-poses yn 'e sêne.

• Identifikaasje
In yndividuele eksimplaar fan in objekt wurdt erkend. Foarbylden binne identifikaasje fan it gesicht of fingerprint fan in spesifike persoan, of identifikaasje fan in spesifyk auto.

• Detection
De ôfbyldingsgegevens wurde skansearre foar in spesifike betingst. Foarbylden binne deteksje fan mooglike abnormale sellen of weefsels yn medyske bylden of deteksje fan in auto yn in automatysk tolsysteem. Deteksje basearre op relatyf ienfâldige en rappe berekkeningen wurdt soms brûkt foar it finen fan lytsere regio's fan nijsgjirrige ôfbyldingsgegevens dy't fierder kinne wurde analysearre troch mear berekkeningseaskende techniken om in juste ynterpretaasje te produsearjen.

Der binne ferskate spesjalisearre taken basearre op erkenning, lykas:

• Ynhâld-basearre ôfbylding opheljen
Hjir fine jo alle ôfbyldings yn in gruttere set ôfbyldings dy't in spesifike ynhâld hawwe. De ynhâld kin op ferskate wizen spesifisearre wurde, bygelyks yn termen fan oerienkomst relatyf oan in doelôfbylding (jou my alle ôfbyldings dy't lykje op ôfbylding X), of yn termen fan sykkritearia op heech nivo jûn as tekstynfier (jou my alle ôfbyldings dy't befetsje in protte huzen, wurde yn 'e winter nommen, en hawwe gjin auto's yn har).

• Pose skatting
wy moatte skatte de posysje of oriïntaasje fan in spesifyk objekt relatyf oan de kamera. In foarbyldapplikaasje foar dizze technyk soe wêze om in robot te helpen by it heljen fan objekten fan in transportband yn in gearkomsteline-situaasje.

• Optical karakter erkenning
OCR dy't identifisearret karakters yn bylden fan printe of hân skreaun tekst, meastal mei it each op it kodearjen fan de tekst yn in formaat mear en ynskeakelje om te bewurkjen of yndeksearjen Department of Computer Science and Engineering, Michigan State University. "De Pattern Recognition and Image Processing (PRIP) Lab-fakulteit en studinten ûndersiikje it gebrûk fan masines om patroanen of objekten te erkennen. Metoaden wurde ûntwikkele om objekten te sinearjen, te ûntdekken hokker fan har funksjes har ûnderskiede fan oaren, en om algoritmen te ûntwerpen dy't troch in masine kinne wurde brûkt om de klassifikaasje te dwaan. Wichtige applikaasjes omfetsje gesichtsherkenning, fingerprint-identifikaasje, dokumintôfbyldingsanalyse, konstruksje fan 3D-objektmodel, robotnavigaasje, en fisualisaasje / ferkenning fan 3D-volumetryske gegevens. Aktuele ûndersyksproblemen omfetsje biometryske autentikaasje, automatyske tafersjoch en folgjen, handgreeploze HCI, gesichtsmodellering, digitale wettermerking en analysearjen fan struktuer fan online dokuminten. Resinte ôfstudearden fan it laboratoarium hawwe wurke oan erkenning fan hânskrift, ferifikaasje fan hantekening, fisueel learen en opheljen fan ôfbyldings.

⦁ Gesichtsherkenning
wy witte dat systemen foar gesichtsherkenning stadichoan populêr wurde as middels foar it ekstrahearjen fan biometryske ynformaasje. Gesichtsherkenning hat in krityske rol yn biometryske systemen en is oantreklik foar ferskate tapassingen, ynklusyf fisuele tafersjoch en feiligens. Fanwegen de algemiene publike akseptaasje fan gesichtsôfbyldings op ferskate dokuminten, hat gesichtsherkenning in grut potensjeel om de folgjende generaasje biometryske technology fan kar te wurden.

Image Recognition Systems

⦁ Bewegingsanalyse
Ferskate taken relatearje oan bewegingsskatting wêrby't in byldsekwinsje wurdt ferwurke om in skatting te meitsjen fan 'e snelheid op elk punt yn' e ôfbylding of yn 'e 3D-sêne, of sels fan' e kamera dy't de ôfbyldings produseart. Foarbylden fan sokke taken binne:

⦁  Ego-beweging
Bepale de stive 3D-beweging (rotaasje en oersetting) fan 'e kamera út in ôfbyldingssekwinsje produsearre troch de kamera.

⦁ Tracking
Tracking is it folgjen fan de bewegingen fan in (meastal) lytsere set ynteressepunten of objekten (bygelyks auto's of minsken) yn 'e ôfbyldingssekwinsje.

⦁ Optyske stream
Dit is om foar elk punt yn 'e ôfbylding te bepalen hoe't dat punt beweecht relatyf oan it byldflak, dat wol sizze, syn skynbere beweging. Dizze beweging is in resultaat fan sawol hoe't it oerienkommende 3D-punt yn 'e sêne beweecht en hoe't de kamera beweecht relatyf oan it toaniel.

⦁ Scene rekonstruksje
Sjoen ien of (typysk) mear bylden fan in sêne, as in fideo, is sêne rekonstruksje as doel om in 3D-model fan it toaniel te berekkenjen. Yn it ienfâldichste gefal kin it model in set fan 3D-punten wêze. Mear ferfine metoaden produsearje in folslein 3D oerflak model

⦁ Ofbylding restauraasje
It doel fan ôfbyldingsherstel is it fuortheljen fan lûd (sensorlûd, bewegingswazige, ensfh.) fan ôfbyldings. De ienfâldichste mooglike oanpak foar lûdferwidering is ferskate soarten filters lykas leechpassfilters of mediaanfilters. Mear ferfine metoaden geane út fan in model fan hoe't de pleatslike byldstruktueren der útsjen, in model dat se ûnderskiedt fan it lûd. Troch earst de ôfbyldingsgegevens te analysearjen yn termen fan de lokale byldstruktueren, lykas rigels of rânen, en dan it filterjen te kontrolearjen op basis fan lokale ynformaasje fan 'e analysestap, wurdt normaal in better nivo fan lûdferwidering krigen yn ferliking mei de ienfâldiger oanpak. In foarbyld op dit mêd is har skilderij. Guon systemen binne selsstannige tapassingen dy't in spesifyk mjit- of deteksjeprobleem oplosse, wylst oaren in subsysteem foarmje fan in grutter ûntwerp dat bygelyks ek subsystemen befettet foar kontrôle fan meganyske actuators, planning, ynformaasjedatabases, man- masine ynterfaces, ensfh De spesifike ymplemintaasje fan in kompjûter fyzje systeem is ek ôfhinklik fan oft syn funksjonaliteit is foarôf oantsjutte of as in part fan it kin wurde leard of wizige ûnder operaasje. D'r binne lykwols typyske funksjes dy't fûn wurde yn in protte kompjûterfisysystemen.

 

Djipper learen mei ôfbyldingsherkenning

Ofbyldingsherkenning wie rûn foar AI. Dochs revolúsjonearret de masine-learen metoaden foar it identifisearjen fan in objekt of it gesicht fan in persoan. Masine learen is lykwols allinich effektyf as d'r gegevens binne om it te fieden. Foar alle automatisearring fan AI is it opdragen om ôfbyldings te identifisearjen gjin ienfâldich fersyk. Us begryp fan fisuele is twadde natuer; it is iets dat wy fan jongs ôf programmearre binne. Itselde freegje fan in masine is gjin ienfâldich proses. Om dy reden is ien fan 'e populêrste foarmen fan AI-erkenning konvolúsjonele neurale netwurken (CNN). CNN is in metoade dy't him rjochtet op piksels dy't neist elkoar lizze. Ofbylden dy't tichtby lizzend binne binne wierskynliker relatearre, wat betsjuttet dat in objekt of gesicht is oerienkomme mei in ôfbylding mei mear transparânsje.
Wylst merken sykje om sosjale media te monetarisearjen, hoewol AI-ôfbyldingsherkenning dúdlike foardielen drage, rinne har gebrûksgefallen folle djipper. Selsridende auto's steane op it punt om it folgjende grutte ding yn 'e autowrâld te wêzen, en AI-ôfbyldingsherkenningstechnyk helpt om se te betsjinjen. In selsridende auto dy't objekten en minsken op 'e dyk detectearje kin, sadat er der net op botst, bart net automatysk. It moat de bylden werkenne om ynformearre besluten te nimmen. Elke selsridende auto is foarsjoen fan ferskate sensoren sadat it oare bewegende auto's, fytsers, minsken kin identifisearje - yn prinsipe alles dat in gefaar kin foarmje. In automatisearre auto moat de gefaren fan 'e dyk ferwurkje lykas in betûfte bestjoerder docht. D'r binne noch in pear aspekten om út te strijken foardat selsridende auto's op 'e dyk reitsje yn 2020. Mar as autoautomatisearring fan auto's begjint, sil AI-ôfbyldingsherkenning ien fan 'e wichtichste sjauffeurs wêze efter har wurkje feilich.
⦁ Ofbylding oanwinst
In digitaal byld wurdt produsearre troch ien of meardere byldsensors, dy't njonken ferskate soarten ljochtgefoelige kamera's ek beriksensors, tomografyske apparaten, radar, ultrasone kamera's, ensfh. Ofhinklik fan it type sensor binne de resultearjende byldgegevens. is in gewoane 2D-ôfbylding, in 3D-folume, of in byldsekwinsje. De pikselwearden komme typysk oerien mei de ljochtintensiteit yn ien of mear spektrale banden (grize bylden of kleurbylden), mar kinne ek besibbe wurde oan ferskate fysike maatregels, lykas djipte, absorption of wjerspegeling fan sonyske of elektromagnetyske weagen, of kearnmagnetyske resonânsje.
⦁ Foarferwurking:
Foardat in kompjûterfisymetoade kin wurde tapast op ôfbyldingsgegevens om wat spesifyk stikje ynformaasje te ekstrahearjen, is it meastentiids nedich om de gegevens te ferwurkjen om te soargjen dat it foldocht oan bepaalde oannames dy't troch de metoade implisearre binne. Foarbylden binne
1. Re-sampling om te soargjen dat it byldkoördinatesysteem korrekt is.
2. Noise reduksje om te soargjen dat sensor lûd net yntrodusearje falske ynformaasje.
3. Kontrastferbettering om te soargjen dat relevante ynformaasje ûntdutsen wurde kin.
4. Skaal-romte fertsjintwurdiging te ferbetterjen byld struktueren op lokaal passende skalen.
⦁ Funksje ekstraksje:
Ofbyldingsfunksjes op ferskate nivo's fan kompleksiteit wurde ekstrakt út 'e ôfbyldingsgegevens. Typyske foarbylden fan sokke funksjes binne linen, rânen en richels
Lokalisearre ynteressepunten lykas hoeken, blobs of punten. Mear komplekse funksjes kinne relatearre wurde oan tekstuer, foarm of beweging.
⦁ Deteksje / segmentaasje:
Op in stuit yn 'e ferwurking wurdt in beslút naam oer hokker byldpunten of regio's fan it byld relevant binne foar fierdere ferwurking. Foarbylden binne
1. Seleksje fan in spesifike set fan ynteresse punten
2. Segmentaasje fan ien of meardere byldregio's dy't in spesifyk objekt fan belang befetsje.
⦁ Ferwurking op heech nivo:
By dizze stap is de ynfier typysk in lytse set gegevens, bygelyks in set punten of in ôfbyldingsregio wêrfan wurdt oannommen dat it in spesifyk objekt befettet. De oerbleaune ferwurking giet bygelyks oer:
1. Ferifikaasje dat de gegevens foldwaan oan model-basearre en applikaasje spesifike oannames.
2. Skatting fan applikaasje spesifike parameters, lykas foarwerp pose of objectsize.
3. Klassifisearjen fan in ûntdutsen objekt yn ferskate kategoryen.Dus, byldferwurking helpt AI om it byld te identifisearjen en te reagearjen neffens de ôfbyldingsidentifikaasje.

In naadleaze takomst fan byldspraak

As de technyk ferbetteret, sil ôfbyldingsherkenning noch gruttere resultaten jaan. Head of Machine Learning by Lobster, Vladimir Pavlov seit: "De wiskundige basis foar objektherkenning bestiet al in lange tiid, mar technologyske mooglikheden foar it brûken fan kompjûterfisyalgoritmen ferskynden koartlyn. Al meitsje neurale netwurken it meitsjen fan perfekte detektors dy't better kinne wurkje as minsken. In grutte jerk hâldt de oanwêzigens fan markearre ôfbyldingsgegevens foar training werom, mar yn 'e heine takomst sil dit gjin probleem wêze. Kompjûterfisy-yngenieurs wurkje aktyf oan sels-learende algoritmen.” Mei in takomst dy't sa bot beynfloede wurdt troch fisuele kommunikaasje, sil byldherkenning de kaaifaktor wêze efter in protte fan 'e foto's dy't wy sjogge. Sawol yn it echte libben as online.