Zergatik garrantzitsua da irudien aitorpena?

Sareko substantziaren %80 inguru bisuala da. Dagoeneko irudien etiketatzeak substantzia-taularen jaun gisa lekua izan dezakeen aztertzen hasteko gai izango zara. Pertsonak edo erakundeak diren kontuan hartu gabe, AI irudien aitorpenari esker on line ikusizkoak objektu hutsalekin bereiztea pentsa daiteke. Urtero 657 milioi argazki inguru argitaratzen dira arretaz, zati handiena sareko komunikabideen bidez agertzen delarik. Irudi horien zati duin bat elementuak aurreratzen ari diren pertsonak dira, ustekabean egiten ari diren ala ez. Bezeroek ekoitzitako edukia (UGC) bere egiturarik perfektuenean markentzako ahalduntze-eragin bikaina da, aurrerapen-mota egokiena ematen baitu.

Iragarki-gailuak daude alarma-erakundeentzat erosleen jakinarazpena sareko komunikabideen bidez dagoenean, baina ez al litzateke zerbait esan behar marken aurrerapena gertatzen denean inork bere izena etiketatu gabe mezu sozialean? Hau da AI irudien aitorpenak bere balioa erakusten duen lekua. Teknologia datu-multzo egokiak zaintzen dituenean, AI-ak argazki bat bereiz dezake etiketa espliziturik erreferentziarik egin gabe. Emaitzak garrantzitsuak dira markek beren ohar sozialen jarraipena egiteko eta jarraitzeko.

Nola funtzionatzen du irudiak ezagutzeko?

Seguruenik dakigunez, AI-ak web-oinarritutako komunikabideen faseetatik begiratu dezake argazkiak bilatzen eta informazio-bilduma zabalekin kontrastatu dezake. Une horretan, jendeak egin dezakeena baino askoz azkarrago bat datorren argazki egokia aukeratzen du. Markek irudien aitorpena erabiltzen dute web-oinarritutako komunikabideen bidez berea bezalako edukia ezagutzeko. Horrek esan nahi du marka baten logotipoa bereiztea edo web-oinarritutako komunikabideen bezeroen artean modu naturalean kokatutako elementuen egoera hautematea. Jendeari datu askoren bidez arrantza dezala eskatzea nekagarria da. Simulatutako adimenak ez du giza hutsegitearen aurrean estresatzen, eta emaitza zehatzak itzultzen ditu maila paregabeetan. Adimen artifizialeko irudien aitorpenek marka bati buruz adierazten dutena pantailaratzen du, testu-eskakizunik gabe. Bezeroek erakundearen izena idazteko itxaropenik gabe beren ohar sozialak jarraitzeko prest dauden markek posizio ezin hobean amaituko dute. AI hautematen diren identifikatzaileen bidez soilik beren lineako inklusioa aprobetxatzeko aukera izugarria da eta paregabeko inklusioa eskaintzen du.

Hona hemen irudiak ezagutzeko ohiko enkargu batzuk: -

Hasieratik erabaki behar dugu irudiaren informazioak artikulu, nabarmendu edo mugimendu jakin bat duen. Esleipen hau normalean gizaki batek gogoz eta esfortzurik gabe jorratu dezake, baina oraindik ez da nahikoa jorratu PC ikuspegian kasu orokorrerako: artikulu auto-asertiboak egoera diskrezionaletan. Gai hau kudeatzeko gaur egungo teknikak artikulu esplizituetarako soilik trata daitezke, adibidez, oinarrizko matematikako elementuak (adibidez, poliedrikoa), giza aurpegiak, inprimatutako edo transkribatutako karaktereak edo ibilgailuak, eta egoera esplizituetan, normalean denetan erretratatuta. elementuaren distira, oinarri eta jarrera bereizgarriaren inguruan kamerarekin alderatuta. Aitorpen-arazoaren hainbat sorta azaltzen dira idatzian:

• Objektuen ezagupena

Aurrez zehaztutako edo ikasitako artikulu edo elementu-klase bat edo batzuk hauteman daitezke, normalean irudian dituzten 2D egoerekin edo eszenan 3D-ko jarrerekin batera.

• Identifikazioa

Artikulu baten kasu indibiduala hautematen da. Modeloak pertsona jakin baten aurpegiaren edo marka bakarraren edo ibilgailu jakin baten IDaren froga bereizgarriak dira.

• Detekzioa

Irudiaren informazioa egoera jakin baterako aztertzen da. Ereduak irudi klinikoetan irudika daitezkeen zelula edo ehun arraroen aurkikuntza edo ibilgailu bat aitortzea dira programatutako kaleko kostuen esparruan. Neurrizko kalkulu sinple eta azkarren menpeko aurkikuntza han eta hemen erabiltzen da irudi-informazio interesgarrien barruti xumeagoak aurkitzeko, eta, gainera, itzulpen egokia sortzeko estrategia konputazional gehiago eskatuz hautsi daitezkeenak.

Aitorpenaren menpe dauden enpresa jakin batzuk daude, adibidez,

• Edukian oinarritutako irudiak berreskuratzea

Hemen irudi guztiak deskubritzea substantzia jakin bat duten irudien antolamendu handiago batean. Substantzia ezusteko modu batean zehaztu daiteke, adibidez, irudi objektibo baten antzekotasun erlatiboan (eman iezadazu irudi guztiak X irudia bezalakoak), edo testu-sarrera gisa ematen diren maila esanguratsuak lortzeko estandarren arabera (eman iezadazu hainbat irudi dituzten irudi guztiak). etxeak, neguan hartzen dira, eta horietan ez dute ibilgailurik).

• Pose balorazioa

artikulu jakin baten posizioa edo norabidea neurtu behar dugu kamerarekin alderatuta. Estrategia honen eredu-aplikazio batek robot bati garraio-lerro bateko elementuak berreskuratzen lagunduko lioke ekoizpen-sistema mekanikoko egoera batean.

• Karaktere optikoen aitorpena

Inprimatutako edo eskuz idatzitako edukiaren irudietan karaktereak bereizten dituen OCR, gehienetan, edukia erakunde batean gehiago kodetzeko eta Michigango Estatuko Unibertsitateko Informatika eta Ingeniaritza Saila aldatzeko edo ordenatzeko ahalmena duena. Objektuak detektatzeko estrategiak sortzen dira, haien aipagarrietatik zein besteengandik ezagutzen dituzten aurkitzeko eta makina batek karakterizazioa egiteko erabil ditzakeen kalkuluak planifikatzeko. Aplikazio esanguratsuek aurpegiaren aitorpena, hatz-inpresioak ezagutzeko froga, grabatutako irudien azterketa, 3Dko artikuluen ereduaren garapena, robotaren ibilbidea eta 3Dko informazio bolumetrikoaren irudikapena/ikerketa barne hartzen dituzte. Ebb eta flow ikerketa-gaiek baieztapen biometrikoa, programatutako behaketa eta jarraipena, heldulekurik gabeko HCI, aurpegien bistaratzea, ur-marka informatizatua eta lineako artxiboen diseinua aztertzen dituzte. Laborategiko ikasle ohiek idazkeraren aitorpena, sinadura egiaztatzea, ikaskuntza bisuala eta irudiak berreskuratzeaz aritu dira.

Model:

Ikusi beharko genuke datu pare bat pixel harrigarri behar direla argazki baten gaia ezagutzeko aukera izateko, MITeko espezialista batek gidatutako talde batek aurkitu duenez. Errebelazio horrek aparteko aurrerapenak eragin ditzake lineako argazkien froga mekanizatu ezagugarrietan eta, azkenean, ordenagailuei premisa bat eman diezaieke jendeak egiten duen bezala ikusteko. Erretratu bereziki laburra ondorioztatzea aurrerapen handia izango litzateke, ondorioz, Interneten dauden milaka milioi irudi inbentarioa egitea pentsagarri bihurtzeko. Orain arte, irudiak bilatzeko modu bakartiak irudi bakoitzerako norbanakoek eskuz sartu dituzten eduki-inskripzioen araberakoak dira, eta argazki askok behar dituzte datu horiek. Programatutako IDak, era berean, norbanakoek kamera informatikoetatik deskargatzen dituzten irudiak ordenagailuetara deskargatzeko hurbilpena emango luke, bakoitza eskuz esperimentatu eta azpititulatu gabe. Gainera, azkenean benetako makina-ikuspegia eragin dezake, eta horrek noizbait robotei beren kameretatik datozen informazioa ordenatzeko eta non dauden ordenatzeko aukera eman diezaieke. Beraz, bi argazkiek [zenbakien] taldekatze parekoa badute, ustez konparatiboak izango dira. orokorrean antzeko artikulu batez egina, orokorrean antzeko antolamendu batean”. Irudi bat inskripzio edo izenburu batekin erlazionatuta egon bada, une horretan bere kode matematikoa koordinatzen duten irudi ezberdinek antzeko elementu bat erakutsiko lukete ziurrenik (adibidez, ibilgailu bat, zuhaitza edo banako bat), beraz, irudi batekin erlazionatutako izena izan daiteke. besteetara eraman zuen. "Argazki askorekin, orokorrean kalkulu sinpleak ere oso ondo funtziona ditzakete" irudiak horrela antzematen.

⦁ Aurpegi-ezagutza

konturatzen gara aurpegiak aitortzeko esparruak etengabe bihurtzen ari direla datu biometrikoak kentzeko metodo gisa. Aurpegiaren aitorpenak oinarrizko zati bat du marko biometrikoetan eta erakargarria da hainbat aplikaziotarako, besteak beste, ikus-ezagutza eta segurtasuna. Txosten ezberdinetan aurpegien irudien aitorpen orokorraren arabera, aurpegien aitorpenak erabakiaren berrikuntza biometriko puntako bihurtzeko potentzial ikaragarria du.

Irudiak ezagutzeko sistemak

⦁ Mugimenduaren azterketa

Zeregin batzuk mugimenduaren ebaluazioarekin identifikatzen dira, non argazki-segida prestatzen den abiaduraren neurgailu bat sortzeko, bai argazkiko foku bakoitzean, bai 3D eszenan, edo baita argazkiak ematen dituen kamerarena ere. Esleipen horien kasuak hauek dira:

⦁ Egoaren mugimendua

Kameraren 3D mugimendu malgugabea (pibota eta interpretazioa) kamerak sortutako argazki-segida batetik erabakitzea.

⦁ Jarraipena

Jarraian, argazkien segidan (adibidez, ibilgailuak edo pertsonak) interes fokuen edo protesten antolamendu apalago baten garapenak jarraituko dira.

⦁ Korronte optikoa

Hau da, irudiko puntu bakoitzerako, puntu hori nola mugitzen den irudiaren planoarekin alderatuz, hau da, bere mugimendu nabaria. Mugimendu hau 3D puntu konparatzailea eszenan nola mugitzen den eta kamera eszenarekin alderatuz nola mugitzen den emaitza da.

⦁ Eszena birsortzea

Eszena baten edo bideo baten argazki bat edo (normalean) gehiago emanda, eszenaren erreprodukzioa eszenaren 3D eredu bat erregistratzea du helburu. Kasurik errazenean eredua 3D foku sorta bat izan daiteke. Estrategia finduagoek 3D gainazal eredu osoa sortzen dute

⦁ Irudia berreraikitzea

Irudiaren berreraikitze-puntua irudietatik zalaparta (sentsoreen zalaparta, mugimendu iluna eta abar) ebakuatzea da. Zalantza kanporatzeko pentsa daitekeen metodologia konplexuena kanal mota desberdinak dira, adibidez, pasabide baxuko kanalak edo erdiko kanalak. Estrategia modernoagoek auzoko irudi-egituren antza duten eredua espero dute, zalapartatik aitortzen dituen eredua. Lehenik eta behin, inguruko irudi-egituren denbora luzean irudiaren informazioa ikertuz, adibidez, lerroak edo ertzak, eta, ondoren, auzoko datuen araberako bereizketa azterketa-urratsetik kontrolatuz, zalaparta-ebakuazio-maila handiagoa lortzen da, oro har, gutxiagorekin alderatuta. metodologia konplexuak. Alor honetako eredu bat haien pintura da. Esparru batzuk estimazio edo aitorpen arazo jakin bati jorratzen dituzten aplikazio independenteak dira, eta beste batzuk, aldiz, plan handiago baten azpi-antolaketa bat osatzen dute, zeinak, adibidez, eragile mekanikoen kontrolerako azpi-esparruak, antolaketa, datu-informazio-baseak, man- makina-interfazeak, eta abar PCaren ikusmen-esparru baten exekuzio partikularra, era berean, bere erabilgarritasuna aldez aurretik zehaztuta badago edo jardueran zehar oso ondo ikasi edo egokitu daitekeen zatiren bat. Badaude, dena den, ordenagailuaren ikusmen ugaritan aurkitzen diren ahalmen erregularrak