Kial grava rekono de bildoj?

Ĉirkaŭ 80% de la substanco en la reto estas vidaj. Vi jam povus komenci eltrovi kial bilda etikedado povas teni sian lokon kiel sinjoro de la substanca tablo. Sendepende ĉu temas pri homoj aŭ organizoj, AI-bildrekono ebligis distingi bildojn interrete kun sensignifa objekto. Tie proksimume 657 miliardoj da fotoj afiŝitaj ĉiujare zorge, kun la plej granda parto aperanta per interretaj amaskomunikiloj. Deca peco de tiuj bildoj estas individuoj avancantaj erojn, sendepende de ĉu ili faras tion hazarde. Kliento produktita enhavo (UGC) en ĝia plej perfekta strukturo estas brila poviga influo por markoj ĉar ĝi donas la plej idealan specon de progreso.

Estas reklamaj aparatoj por alarmi organizojn kiam estas aĉetanto-avizo per interretaj amaskomunikiloj, tamen ĉu oni ne devas diri ion pri kiam la progresado de la markoj okazas sen ke iu etikedu sian nomon en la socia afiŝo? Ĉi tiu estas la loko kie AI-bildrekono pruvas sian valoron. En la okazo, ke la teknologio prizorgas la ĝustajn datumajn arojn, AI povas distingi bildon sen eksplicita etikedo al kiu referencoj. La rezultoj estas gravaj por markoj spuri kaj sekvi siajn sociajn avizojn.

Kiel funkcias bilda rekono?

Kiel ni verŝajne konscias, AI povas trarigardi interretajn amaskomunikilajn stadiojn serĉante fotojn kaj kontrasti ilin kun larĝaj informaj kolektoj. Ĝi tiam elektas trafan bildon, kiu kongruas kun rapideco multe pli rapide ol homoj kapablas fari. Markoj uzas bildan agnoskon por malkovri enhavon kiel sia propra per ret-bazita amaskomunikilaro. Tio implicas distingi la emblemon de marko aŭ percepti nature poziciigitan objektosituacion inter ret-bazitaj amaskomunikilaj klientoj. Peti, ke homoj fiŝkaptas tiom multe da datumoj efike laciiĝas. Simulita inteligenteco ne emfazas super la homa eraro, kaj resendas precizajn rezultojn sur nekompareblaj niveloj. Artefarita inteligenteco bilda agnosko ekranoj kion individuoj deklaras pri marko sen la postulo por teksto. Markoj pretaj sekvi siajn sociajn avizojn sen klientoj atendantaj tajpi la organizonomon finiĝos en valorega pozicio. La ebleco utiligi sian propran interretan inkludon ekskluzive per AI perceptitaj identigiloj estas grandega kaj ofertas senrivalan inkludon.

Jen kelkaj kutimaj taskoj de bilda rekono: -

Dekomence ni devas decidi ĉu la bildinformoj enhavas iun apartan artikolon, elstaraĵon aŭ movon. Ĉi tiu tasko kutime povas esti traktita elkore kaj sen fortostreĉo de homo, tamen estas ankoraŭ ne sufiĉe pritraktita en komputila vizio por la ĝenerala kazo: mem-asertaj artikoloj en liberaj cirkonstancoj. La nunaj teknikoj por administri ĉi tiun aferon povas esti plej bone traktataj nur por eksplicitaj artikoloj, ekzemple, bazaj matematikaj eroj (ekz., pluredraj), homaj vizaĝoj, presitaj aŭ transskribitaj signoj, aŭ veturiloj, kaj en eksplicitaj cirkonstancoj, ordinare portretitaj ĝis ĉiuj. ĉirkaŭ karakterizita heligado, fundamento kaj pozo de la objekto kompara kun la fotilo. Diversaj sortimentoj de la agnoska temo estas portretitaj en la skribo:

• Objektrekono

Unu aŭ kelkaj antaŭdestinitaj aŭ lernitaj artikoloj aŭ objektoklasoj povas esti perceptitaj, normale kune kun iliaj 2D-situacioj en la bildo aŭ 3D-pozoj en la sceno.

• Identigo

Individua kazo de artikolo estas perceptata. Modeloj estas distinga pruvo de la vizaĝo aŭ unika marko de aparta individuo, aŭ ID de speciala veturilo.

• Detekto

La bildinformoj estas ekzamenitaj por aparta kondiĉo. Modeloj estas malkovro de imageblaj strangaj ĉeloj aŭ histoj en klinikaj bildoj aŭ rekono de veturilo en programita stratkostokadro. Malkovro dependa de modere simplaj kaj rapidaj kalkuloj estas ĉi tie kaj tie uzata por trovi pli modestajn distriktojn de interesaj bildaj informoj, kiuj povas esti aldone rompitaj per pli komputile petado de strategioj por krei ĝustan tradukon.

Kelkaj apartaj entreprenoj dependantaj de agnosko ekzistas, ekzemple,

• Enhavo bazita bildo reakiro

Ĉi tie malkovrante ĉiujn bildojn en pli granda aranĝo de bildoj, kiuj havas apartan substancon. La substanco povas esti determinita en neatendita maniero, ekzemple laŭ simileco relative al objektiva bildo (donu al mi ĉiujn bildojn kiel bildon X), aŭ ĝis signifa nivelo serĉnormoj donitaj kiel tekst-enigo (donu al mi ĉiujn bildojn kiuj enhavas multajn bildojn). domoj, estas prenitaj dum vintro, kaj ne havas veturilojn en ili).

• Poza takso

ni devas mezuri la pozicion aŭ direkton de aparta artikolo kompare kun la fotilo. Modela petskribo por tiu strategio helpus roboton reakiri erojn de transportlinio en mekanika produktadsistemcirkonstanco.

• Optika karaktero agnosko

OCR kiu distingas signojn en bildoj de presita aŭ mane skribita enhavo, plejparte kun la fina celo pli kodi la enhavon en organizo kaj povigi ŝanĝi aŭ ordigi Sekcion de Komputika Scienco kaj Inĝenierado, Michigan State University. Strategioj estas kreitaj por detekti objektojn, por trovi kiuj el iliaj kulminaĵoj rekonas ilin de aliaj, kaj por plani kalkulojn kiuj povas esti utiligitaj per maŝino por fari la karakterizadon. Signifaj aplikoj asimilas vizaĝkonon, fingroimpreson rekoneblan pruvon, rekordan bildekzamenon, 3D artikolmodelevoluon, robotitineron, kaj reprezentadon/enketon de 3D volumetraj informoj. Malfluaj kaj fluaj esplortemoj asimilas biometrikan konfirmon, programitan observadon kaj sekvadon, senmanieron HCI, vizaĝmontradon, komputilizitan akvomarkon kaj ekzamenantan dezajnon de retaj arkivoj. Malfruaj eks-studentoj de la laboratorio traktis agnoskon pri skribmaniero, subskribokontrolo, vida lernado kaj bilda reakiro."

modelo

Ni devus vidi, ke necesas ŝoke kelkaj pikseloj da datumoj por havi la eblon rekoni la temon de bildo, grupo gvidita de MIT-specialisto trovis. La revelacio povus kaŭzi eksterordinarajn progresojn en la mekanizita rekonebla pruvo de interretaj bildoj kaj, finfine, doni kondiĉon al komputiloj por vidi kiel homoj faras. Dedukti precipe mallongan portretadon estus grava antaŭeniĝo al igi ĝin imagebla inventari la miliardojn da bildoj en la Interreto sekve. Nuntempe, la solaj aliroj por serĉi bildojn dependas de enhavaj surskriboj, kiujn individuoj mane eniris por ĉiu bildo, kaj multaj bildoj bezonas tiajn datumojn. Programita ID same donus aliron al dosierbildoj kiujn individuoj elŝutas de komputiligitaj fotiloj al siaj komputiloj, sen sperti kaj subtekstigi ĉiun permane. Ankaŭ, finfine ĝi povus instigi aŭtentan maŝinvizion, kiu iam povus permesi al robotoj ordigi la informojn venantajn de siaj fotiloj kaj ordigi kie ili estas. tiel ke se du bildoj havas kompareblan grupigon [de nombroj], ili estas supozeble komparaj. farita el ĝenerale simila artikolo, ĝenerale simila aranĝo.” Se unu bildo estis rilatita al surskribo aŭ titolo, ĉe tiu punkto malsamaj bildoj kiuj kunordigas ĝian matematikan kodon verŝajne montrus similan objekton, (ekzemple, veturilo, arbo aŭ individuo) tiel la nomo rilata al unu bildo povas esti translokiĝis al la aliaj. "Kun ekstreme multaj bildoj, eĉ ĝenerale simplaj kalkuloj povas plenumi vere bone" rekonante bildojn tiel.

⦁ Vizaĝa Rekono

ni rimarkas, ke vizaĝ-regnoskadroj senĉese famiĝas kiel metodoj por forigi biometriajn datumojn. Vizaĝa agnosko havas bazan parton en biometrikaj kadroj kaj allogas por diversaj aplikoj inkluzive de vida sciigo kaj sekureco. En lumo de la ĝenerala agnosko de vizaĝbildoj en malsamaj raportoj, vizaĝ-rekono havas nekredeblan potencialon iĝi la avangarda biometria novigado de decido.

Bildaj Rekonaj Sistemoj

⦁ Movada ekzameno

Kelkaj taskoj identiĝas kun movadtakso kie bildsinsekvo estas preta krei mezurilon de la rapideco aŭ ĉe ĉiu fokuso en la bildo aŭ en la 3D sceno, aŭ eĉ de la fotilo kiu liveras la bildojn. Okazoj de tiaj taskoj estas:

⦁ Egomovado

Decidante la 3D neflekseblan movadon (pivoto kaj interpreto) de la fotilo de bildsinsekvo kreita per la fotilo.

⦁ Spurado

Sekvas sekvos la evoluoj de (ĝenerale) pli modesta aranĝo de interesfokusoj aŭ protestoj (ekz. veturiloj aŭ homoj) en la bilda sinsekvo.

⦁ Optika fluo

Ĉi tio estas decidi, por ĉiu punkto en la bildo, kiel tiu punkto moviĝas kompare kun la bildaviadilo, t.e. ĝia evidenta movado. Ĉi tiu movado estas rezulto kaj de kiel la kompara 3D-punkto moviĝas en la sceno kaj kiel la fotilo moviĝas kompare kun la sceno.

⦁ Scenrefarado

Donita unu aŭ (ordinare) pli da bildoj de sceno, aŭ vidbendo, scenoreproduktado celas registri 3D modelon de la sceno. En la plej facila kazo la modelo povas esti amaso da 3D-fokusoj. Pli rafinitaj strategioj produktas totalan 3D surfacmodelon

⦁ Rekonstruado de bildoj

La punkto de bildrekonstruado estas la evakuado de tumulto (sensila krio, movo obskura, ktp) de bildoj. La malplej kompleksa pensebla metodaro por tumultelpelo estas malsamaj specoj de kanaloj, ekzemple, malalt-pasaj kanaloj aŭ mezaj kanaloj. Pli modernaj strategioj atendas modelon de kiel la najbarecaj bildstrukturoj similas, modelon kiu rekonas ilin de la tumulto. Unue esplorante la bildinformojn en sufiĉe da tempo de la proksimaj bildstrukturoj, ekzemple, linioj aŭ randoj, kaj poste kontrolante la apartigon dependan de najbarecdatenoj de la ekzamenpaŝo, supera grado de tumulta evakuado estas ĝenerale komparita kun la malpli. kompleksaj metodaroj. Modelo en ĉi tiu kampo estas ilia pentraĵo. Kelkaj kadroj estas sendependaj aplikoj kiuj traktas specialan taksadon aŭ rekonan problemon, dum aliaj konsistas el sub-aranĝo de pli granda plano kiu, ekzemple, same enhavas sub-kadrojn por kontrolo de mekanikaj aktuarioj, aranĝado, dateninformbazoj, man- maŝininterfacoj, kaj tiel plu La aparta ekzekuto de komputila viziokadro same dependas de ĉu ĝia utileco estas antaŭdeterminita aŭ ĉu iu peco de ĝi tre bone povas esti lernita aŭ ĝustigita dum agado. Estas, kiel ajn, regulaj kapabloj, kiuj troviĝas en multnombra komputila vidado