Waarom beeldherkenning belangrik?

Ongeveer 80% van die stof op die web is visueel. Jy sal reeds kan begin uitwerk waarom prentetikettering sy plek as heer van die stoftafel kan beklee. Ongeag of dit mense of organisasies is, KI-beeldherkenning het dit denkbaar gemaak om beeldmateriaal aanlyn met onbeduidende voorwerp te onderskei. Daar word ongeveer 657 miljard foto's elke jaar versigtig geplaas, met die grootste deel wat via aanlynmedia verskyn. 'n Ordentlike stuk van daardie prente is individue wat items aanbeweeg, ongeag of hulle dit per ongeluk doen. Kliëntvervaardigde inhoud (UGC) in sy mees volmaakte struktuur is 'n briljante bemagtigende invloed vir handelsmerke, aangesien dit die mees ideale soort vooruitgang gee.

Daar is advertensie-toestelle om organisasies te alarmeer wanneer daar 'n koperkennisgewing via aanlynmedia is, moet daar egter nie iets gesê word oor wanneer handelsmerkbevordering plaasvind sonder dat iemand hul naam in die sosiale plasing etiketteer nie? Dit is die plek waar KI-beeldherkenning die waarde daarvan demonstreer. Met die kans dat die tegnologie na die regte datastelle versorg word, kan KI 'n prentjie onderskei sonder eksplisiete etiket waarna verwys word. Die uitkomste is belangrik vir handelsmerke om hul sosiale kennisgewings op te spoor en te volg.

Hoe werk beeldherkenning?

Soos ons waarskynlik bewus is, kan KI deur webgebaseerde mediastadiums kyk en na foto's soek en dit kontrasteer met breë inligtingsversamelings. Dit kies op daardie stadium pertinente prentjie wat ooreenstem teen 'n koers wat baie vinniger is as wat mense in staat is om te doen. Handelsmerke gebruik foto-erkenning om inhoud soos hul eie via webgebaseerde media te ontdek. Dit impliseer om 'n handelsmerk se logo te onderskei of 'n natuurlike geposisioneerde itemsituasie onder webgebaseerde mediakliënte waar te neem. Om te versoek dat mense so baie data effektief deurvis, raak vermoeiend. Gesimuleerde intelligensie stres nie oor die menslike flater nie, en lewer presiese uitkomste op ongeëwenaarde vlakke. Kunsmatige intelligensie prentjie erkenning skerm wat individue sê oor 'n handelsmerk sonder die vereiste vir teks. Handelsmerke wat gereed is om hul sosiale kennisgewings te volg sonder dat kliënte verwag om die organisasie se naam in te tik, sal in 'n onskatbare posisie beland. Die moontlikheid om voordeel te trek uit hul eie aanlyn-insluiting uitsluitlik deur middel van KI-waargenome identifiseerders is geweldig en bied ongeëwenaarde insluiting.

Hier is 'n paar algemene boodskappe van beeldherkenning: -

Van die begin af moet ons besluit of die prentinligting 'n spesifieke artikel, hoogtepunt of beweging bevat. Hierdie opdrag kan tipies hartlik en sonder inspanning deur 'n mens aangespreek word, maar is nog nie voldoende in PC-visie aangepak vir die algehele geval nie: selfgeldende artikels in diskresionêre omstandighede. Die huidige tegnieke vir die bestuur van hierdie kwessie kan die beste aangepak word net vir eksplisiete artikels, byvoorbeeld basiese wiskundige items (bv. veelvlakkige), menslike gesigte, gedrukte of getranskribeerde karakters, of voertuie, en in eksplisiete omstandighede, gewoonlik uitgebeeld so ver as alle rondom gekenmerk verheldering, fondament, en postuur van die item vergelykende met die kamera. Verskeie verskeidenheid van die erkenningskwessie word in die skrif uitgebeeld:

• Voorwerpherkenning

Een of 'n paar voorafbepaalde of aangeleerde artikels of itemklasse kan waargeneem word, gewoonlik saam met hul 2D-situasies in die prentjie of 3D-houdings in die toneel.

• Identifikasie

'n Individuele geval van 'n artikel word waargeneem. Modelle is 'n onderskeidende bewys van 'n spesifieke individu se gesig of unieke merk, of ID van 'n spesifieke voertuig.

• Opsporing

Die prentinligting word vir 'n bepaalde toestand ondersoek. Modelle is die ontdekking van denkbare vreemde selle of weefsels in kliniese foto's of herkenning van 'n voertuig in 'n geprogrammeerde straatkosteraamwerk. Ontdekking wat afhanklik is van redelik eenvoudige en vinnige berekeninge word hier en daar aangewend om meer beskeie distrikte van intrige prentinligting te vind wat bykomend afgebreek kan word deur meer berekeningstrategieë om 'n regte vertaling te skep.

'n Paar spesifieke ondernemings wat afhanklik is van erkenning bestaan, bv.

• Inhoudgebaseerde beeldherwinning

Hier ontdek alle prente in 'n groter rangskikking van prente wat 'n spesifieke stof het. Die stof kan op 'n onverwagte manier bepaal word, byvoorbeeld so ver as gelykenis relatief tot 'n objektiewe prent (gee vir my alle prente soos prent X), of sover as beduidende vlak strewe standaarde gegee as teksinvoer (gee vir my alle prente wat talle bevat huise, word gedurende die winter geneem en het geen voertuie in nie).

• Posisie-assessering

ons moet die posisie of rigting van 'n spesifieke artikel vergelykend met die kamera meet. 'n Modeltoepassing vir hierdie strategie sal 'n robot help om items van 'n vervoerlyn te herwin in 'n meganiese produksiestelsel-omstandigheid.

• Optiese karaktererkenning

OCR wat karakters in prente van gedrukte of handgeskrewe inhoud onderskei, meestal met die einddoel om die inhoud in 'n organisasie meer te enkodeer en te bemagtig om Departement Rekenaarwetenskap en Ingenieurswese, Michigan State University te verander of te bestel. Strategieë word geskep om voorwerpe op te spoor, om te vind watter van hul hoogtepunte hulle van ander herken, en om berekeninge te beplan wat deur 'n masjien gebruik kan word om die karakterisering te doen. Beduidende toepassings sluit in gesigserkenning, vingerafdrukherkenbare bewys, rekordfoto-ondersoek, 3D-artikelmodelontwikkeling, robotroete en voorstelling/ondersoek van 3D-volumetriese inligting. Eb en vloei navorsingskwessies sluit biometriese bevestiging, geprogrammeerde waarneming en volg, handlose HCI, gesigvertoning, gerekenariseerde watermerk en ondersoek ontwerp van aanlyn argiewe in. Laat alumni van die laboratorium het te doen gehad met erkenning van skryfkuns, handtekeningkontrole, visuele leer en beeldherstel.”

model:

Ons moet sien dat dit 'n skokkende paar pixels data verg om die opsie te hê om die onderwerp van 'n prent te herken, het 'n groep wat deur 'n MIT-spesialis bestuur is, bevind. Die onthulling kan buitengewone vooruitgang in die gemeganiseerde herkenbare bewys van aanlynfoto's veroorsaak en uiteindelik 'n uitgangspunt aan rekenaars gee om te sien soos mense doen. Om 'n besonder kort uitbeelding af te lei, sal 'n beduidende vooruitgang wees om dit denkbaar te maak om die miljarde prente op die internet gevolglik te inventaris. Van nou af hang die eensame benaderings om na prente te soek af van inhoudinskripsies wat individue met die hand vir elke prent ingevoer het, en talle prente benodig sulke data. Geprogrammeerde ID sal eweneens 'n benadering gee om foto's te lêer wat individue van gerekenariseerde kameras op hul rekenaars aflaai, sonder om elkeen met die hand te ervaar en te ondertitel. Dit kan ook uiteindelik ware masjienvisie veroorsaak, wat robotte soms kan toelaat om die inligting wat van hul kameras af kom, uit te sorteer en uit te sorteer waar hulle is. sodat as twee prente 'n vergelykbare groepering [van getalle het], hulle vermoedelik vergelykend is gemaak van gewoonlik 'n soortgelyke artikel, in die algemeen 'n soortgelyke rangskikking.” As een prent met 'n inskripsie of titel verband hou, sal verskillende prente wat die wiskundige kode daarvan koördineer waarskynlik 'n soortgelyke item wys (byvoorbeeld 'n voertuig, boom of individu), dus kan die naam wat met een prent verband hou, wees na die ander verskuif. "Met uiters baie prente, kan selfs oor die algemeen eenvoudige berekeninge werklik goed presteer" om prente so te herken.

⦁ Gesigsherkenning

ons besef dat gesigserkenningsraamwerke voortdurend bekend word as metodes om biometriese data te verwyder. Gesigserkenning het 'n basiese rol in biometriese raamwerke en is aanloklik vir verskeie toepassings, insluitend visuele verkenning en sekuriteit. In die lig van die algehele bevolkingserkenning van gesigfoto's op verskillende verslae, het gesigserkenning 'n ongelooflike potensiaal om te verander in die voorpunt van biometriese innovasie van besluit.

Beeldherkenningstelsels

⦁ Bewegingsondersoek

'n Paar opdragte identifiseer met bewegingsassessering waar 'n prentopeenvolging voorberei word om 'n maatstaf te skep van die spoed óf by elke fokus in die prent óf in die 3D-toneel, of selfs van die kamera wat die prente lewer. Gevalle van sulke opdragte is:

⦁ Ego-beweging

Besluit die 3D-onbuigsame beweging (spilpunt en interpretasie) van die kamera uit 'n foto-opeenvolging wat deur die kamera geskep is.

⦁ Opsporing

Volgende sal die ontwikkelinge van 'n (oor die algemeen) meer beskeie rangskikking van belangstellingsfokusse of protes (bv. voertuie of mense) in die prentjie opeenvolging volg.

⦁ Optiese stroom

Dit is om vir elke punt in die prent te besluit hoe daardie punt in vergelyking met die prentvlak beweeg, dit wil sê sy duidelike beweging. Hierdie beweging is 'n uitkoms van hoe die vergelykende 3D-punt in die toneel beweeg en hoe die kamera in vergelyking met die toneel beweeg.

⦁ Toneelhermaak

Gegewe een of (gewoonlik) meer foto's van 'n toneel, of 'n video, is toneelreproduksie teikens wat 'n 3D-model van die toneel registreer. In die maklikste geval kan die model 'n klomp 3D-fokusse wees. Meer verfynde strategieë produseer 'n totale 3D-oppervlakmodel

⦁ Beeld herbou

Die punt van prentherbou is die ontruiming van rumoer (sensorgeluid, beweging obskure, ensovoorts) uit prente. Die minste komplekse denkbare metodologie vir rumoer-uitsetting is verskillende soorte kanale, byvoorbeeld laagdeurlaatkanale of middelkanale. Meer moderne strategieë verwag 'n model van hoe die buurtprentstrukture lyk, 'n model wat hulle uit die rumoer herken. Deur eers die prentinligting oor 'n geruime tyd van die nabygeleë prentstrukture te ondersoek, byvoorbeeld lyne of rande, en daarna die skeidingsafhanklike van buurtdata vanaf die eksamenstap te beheer, word 'n superieure mate van rumoerontruiming oor die algemeen gekontrasteer met die minder komplekse metodologieë. 'n Model op hierdie gebied is hul skildery. 'n Paar raamwerke is onafhanklike toepassings wat 'n bepaalde skatting- of herkenningskwessie aanspreek, terwyl ander 'n sub-reëling van 'n groter plan behels wat, byvoorbeeld, eweneens subraamwerke bevat vir beheer van meganiese aktuators, rangskikking, data-inligtingbasisse, man- masjienkoppelvlakke, ensovoorts. Die spesifieke uitvoering van 'n rekenaarvisieraamwerk is eweneens afhanklik as die bruikbaarheid daarvan vooraf bepaal is of as 'n stuk daarvan baie goed aangeleer of aangepas kan word tydens aktiwiteit. Daar is, hoe dit ook al sy, gereelde vermoëns wat in talle rekenaarvisie voorkom