Għaliex ir-rikonoxximent tal-immaġni importanti?

Madwar 80% tas-sustanza fuq il-web hija viżwali. Diġà tkun tista' tibda taħdem għaliex it-tikkettjar tal-istampa jista' jżomm postu bħala sid tat-tabella tas-sustanza. Irrispettivament minn jekk hux nies jew organizzazzjonijiet, ir-rikonoxximent tal-immaġni AI għamilha konċepibbli li tiddistingwi viżwali onlajn b'oġġett insinifikanti. Hemm madwar 657 biljun ritratt mibgħuta kull sena bir-reqqa, bil-parti l-kbira tidher permezz tal-midja onlajn. Biċċa deċenti minn dawk l-istampi huma individwi li javvanzaw oġġetti, irrispettivament minn jekk humiex qed jagħmlu dan aċċidentalment. Il-kontenut prodott mill-klijenti (UGC) fl-istruttura l-aktar perfetta tiegħu huwa influwenza brillanti li tagħti s-setgħa lill-marki peress li jagħti l-aktar tip ideali ta 'avvanz.

Hemm apparati ta' reklamar għall-organizzazzjonijiet ta' allarm meta jkun hemm avviż tax-xerrej permezz tal-midja onlajn, madankollu m'għandux jingħad xi ħaġa dwar meta l-marki javvanzaw mingħajr ma ħadd ma jittikkettja isimhom fil-post soċjali? Dan huwa l-post fejn ir-rikonoxximent tal-immaġni AI juri l-valur tiegħu. Fil-każ li t-teknoloġija tieħu ħsieb is-settijiet ta 'dejta t-tajbin, l-AI tista' tiddistingwi stampa mingħajr tikketta espliċita tagħmel referenza għaliha. Ir-riżultati huma importanti għall-marki biex isegwu u jsegwu l-avviżi soċjali tagħhom.

Kif jaħdem ir-rikonoxximent tal-immaġni?

Kif x'aktarx nafu l-AI tista' tħares minn stadji tal-midja bbażati fuq il-web biex tfittex ritratti u tikkuntrastahom ma' kollezzjonijiet ta' informazzjoni wiesgħa. F'dak il-punt jagħżel stampa pertinenti li taqbel b'rata ħafna aktar mgħaġġla milli n-nies huma kapaċi jagħmlu. Il-marki jużaw rikonoxximent tal-istampa biex jiskopru kontenut bħal tagħhom permezz tal-midja bbażata fuq il-web. Dan jimplika li ssir distinzjoni bejn il-logo ta' marka jew li tipperċepixxi sitwazzjoni ta' oġġett b'pożizzjoni naturali fost il-klijenti tal-midja bbażati fuq il-web. Li titlob li n-nies jistadu permezz ta 'tali dejta effettivament issir għeja. L-intelliġenza simulata ma tenfasizzax il-blunder uman, u tagħti riżultati eżatti f'livelli mhux imqabbla. Ir-rikonoxximent tal-istampa tal-intelliġenza artifiċjali skrins dak li qed jiddikjaraw l-individwi dwar marka mingħajr il-ħtieġa għal test. Marki lesti li jsegwu l-avviżi soċjali tagħhom mingħajr ma l-klijenti jistennew li jittajpja l-isem tal-organizzazzjoni jispiċċaw f'pożizzjoni imprezzabbli. Il-possibbiltà li jieħdu vantaġġ mill-inklużjoni onlajn tagħhom stess esklussivament permezz ta' identifikaturi perċepiti mill-AI hija immensa u toffri inklużjoni bla konfront.

Hawn xi xogħlijiet komuni ta' rikonoxximent tal-immaġni:-

Mill-bidu rridu niddeċiedu jekk l-informazzjoni tal-istampa fiha xi artiklu partikolari, enfasi, jew moviment. Dan l-inkarigu jista' tipikament jiġi indirizzat bil-qalb u mingħajr sforz minn bniedem, iżda għadu mhux ittrattat biżżejjed fil-viżjoni tal-PC għall-każ ġenerali: artikoli awto-assertivi f'ċirkostanzi diskrezzjonali. It-tekniki attwali għall-ġestjoni ta’ din il-kwistjoni jistgħu jiġu ttrattati bl-aħjar mod biss għal artikoli espliċiti, pereżempju, oġġetti matematiċi bażiċi (eż., poliedriċi), uċuħ umani, karattri stampati jew traskritti, jew vetturi, u f’ċirkostanzi espliċiti, normalment murija sa kull madwar ikkaratterizzat dawl, pedament, u l-qagħda tal-oġġett komparattiv mal-kamera. Diversi assortimenti tal-kwistjoni tar-rikonoxximent huma murija fil-kitba:

• Rikonoxximent tal-oġġett

Wieħed jew ftit artikli jew klassijiet ta' oġġetti predeterminati jew mitgħallma jistgħu jiġu pperċepiti, normalment flimkien mas-sitwazzjonijiet 2D tagħhom fl-istampa jew qagħdiet 3D fix-xena.

• Identifikazzjoni

Każ individwali ta' oġġett jiġi pperċepit. Il-mudelli huma prova ta' distinzjoni tal-wiċċ ta' individwu partikolari jew marka unika, jew ID ta' vettura partikolari.

• Sejbien

L-informazzjoni tal-istampa hija eżaminata għal kundizzjoni partikolari. Mudelli huma skoperta ta 'ċelluli strambi konċepibbli jew tessuti fi stampi kliniċi jew rikonoxximent ta' vettura f'qafas ta 'spejjeż tat-triq ipprogrammat. Skoperta dipendenti fuq kalkoli moderatament sempliċi u veloċi hija utilizzata hawn u hemm biex jinstabu distretti aktar modesti ta 'informazzjoni ta' stampa intriganti li tista 'tinkisser addizzjonalment billi titlob strateġiji b'mod aktar komputazzjoni biex tinħoloq traduzzjoni tajba.

Jeżistu ftit impriżi partikolari li jiddependu fuq ir-rikonoxximent, pereżempju,

• Irkupru ta 'stampa bbażat fuq il-kontenut

Hawnhekk jiskopru l-istampi kollha f'arranġament akbar ta 'stampi li għandhom sustanza partikolari. Is-sustanza tista’ tiġi determinata b’mod mhux mistenni, pereżempju sa fejn tixbihat relattiv stampa oġġettiva (agħtini l-istampi kollha bħall-istampa X), jew sa fejn standards ta’ insegwiment ta’ livell sinifikanti mogħtija bħala input ta’ test (agħtini l-istampi kollha li fihom bosta djar, jittieħdu matul ix-xitwa, u ma jkollhomx vetturi fihom).

• Valutazzjoni tal-pożizzjoni

rridu nkejlu l-pożizzjoni jew id-direzzjoni ta 'oġġett partikolari komparattiva mal-kamera. Applikazzjoni mudell għal din l-istrateġija tgħin lil robot jirkupra oġġetti minn linja tat-trasport f'ċirkustanza ta 'sistema ta' produzzjoni mekkanika.

• Rikonoxximent tal-karattru ottiku

OCR li jiddistingwi karattri fi stampi ta 'kontenut stampat jew miktub manwalment, fil-biċċa l-kbira bl-għan aħħari li jikkodifika l-kontenut f'organizzazzjoni aktar u jagħti s-setgħa li jibdel jew jordna Dipartiment tax-Xjenza u l-Inġinerija tal-Kompjuter, Michigan State University. Jinħolqu strateġiji biex jinstabu oġġetti, biex isibu liema mill-punti ewlenin tagħhom jirrikonoxxuhom minn oħrajn, u biex jippjanaw kalkoli li jistgħu jiġu utilizzati minn magna biex tagħmel il-karatterizzazzjoni. Applikazzjonijiet sinifikanti jinkorporaw rikonoxximent tal-wiċċ, prova rikonoxxibbli tal-impressjoni tas-swaba ', eżami tal-istampa rekord, żvilupp ta' mudell ta 'artikoli 3D, rotta robot, u rappreżentazzjoni/investigazzjoni ta' informazzjoni volumetrika 3D. Kwistjonijiet ta 'riċerka Ebb u fluss jinkorporaw konferma bijometrika, osservazzjoni programmata u segwitu, HCI mingħajr manki, wiri tal-wiċċ, watermarking kompjuterizzat u disinn ta' eżaminazzjoni ta 'arkivji onlajn. Alumni tard tal-laboratorju ttrattaw ir-rikonoxximent tal-penmanship, il-kontroll tal-firma, it-tagħlim viżwali, u l-irkupru tal-istampi.”

mudell:

Għandna naraw li jeħtieġ xokkanti ftit pixels ta 'dejta biex ikollhom l-għażla li jirrikonoxxu s-suġġett ta' stampa, sab grupp misjuq minn speċjalista tal-MIT. Ir-rivelazzjoni tista 'twassal għal avvanzi straordinarji fil-prova mekkanizzata rikonoxxibbli ta' stampi onlajn u, fl-aħħar, tagħti premessa lill-PCs biex jaraw bħalma jagħmlu n-nies. Li jiġi dedott ritratt partikolarment qasir ikun avvanz sinifikanti biex ikun konċepibbli li jiġu inventarji ta 'biljuni ta' stampi fuq l-Internet konsegwentement. Minn issa, l-approċċi waħedhom biex tfittex stampi jiddependu fuq iskrizzjonijiet tal-kontenut li l-individwi jkunu daħlu bl-idejn għal kull immaġini, u bosta stampi jeħtieġu tali data. L-ID programmat bl-istess mod jagħti approċċ għall-fajl stampi li l-individwi jniżżlu minn kameras kompjuterizzati fuq il-kompjuters tagħhom, mingħajr ma jesperjenzaw u jissottotitolaw kull wieħed bl-idejn. Ukoll, fl-aħħar jista 'jwassal għal viżjoni ġenwina tal-magni, li xi kultant tista' tippermetti lir-robots issolvi l-informazzjoni li ġejja mill-kameras tagħhom u jissolvu fejn qegħdin. sabiex jekk żewġ stampi jkollhom grupp komparabbli [ta' numri], huma preżumibbilment komparattivi. magħmul minn oġġett ġeneralment simili, ġeneralment b’arranġament simili.” Jekk stampa waħda kienet relatata ma' skrizzjoni jew titolu, f'dak il-punt stampi differenti li jikkoordinaw il-kodiċi matematiku tagħha probabbilment juru oġġett simili, (per eżempju, vettura, siġra, jew individwu) għalhekk l-isem relatat ma' stampa waħda jista' jkun tmexxa għall-oħrajn. "B'ħafna stampi, anke kalkoli ġeneralment sempliċi jistgħu jaħdmu ġenwinament tajjeb" biex jagħrfu l-istampi b'hekk.

⦁ Rikonoxximent tal-wiċċ

nirrealizzaw li l-oqfsa ta’ rikonoxximent tal-wiċċ qed isiru kontinwament famużi bħala metodi għat-tneħħija tad-dejta bijometrika. Ir-rikonoxximent tal-wiċċ għandu parti bażika fl-oqfsa bijometriċi u huwa attraenti għal diversi applikazzjonijiet inklużi t-tkixxif viżwali u s-sigurtà. Fid-dawl tar-rikonoxximent ġenerali tal-popolazzjoni tal-istampi tal-wiċċ fuq rapporti differenti, ir-rikonoxximent tal-wiċċ għandu potenzjal inkredibbli li jinbidel fl-innovazzjoni bijometrika avvanzata tad-deċiżjoni.

Sistemi ta' Rikonoxximent ta' Stampi

⦁ Eżami tal-mozzjoni

Ftit inkarigi jidentifikaw mal-valutazzjoni tal-moviment fejn suċċessjoni ta 'stampa hija ppreparata biex toħloq gauge tal-veloċità jew f'kull fokus fl-istampa jew fix-xena 3D, jew saħansitra tal-kamera li tagħti l-istampi. Każijiet ta’ assenjazzjonijiet bħal dawn huma:

⦁ Moviment tal-ego

Jiddeċiedu l-moviment inflessibbli 3D (pern u interpretazzjoni) tal-kamera minn suċċessjoni ta 'stampa maħluqa mill-kamera.

⦁ Traċċar

Li ġej se jkun issegwi l-iżviluppi ta 'arranġament (ġeneralment) aktar modest ta' fokus ta 'interess jew protesti (eż., vetturi jew nies) fis-suċċessjoni tal-istampa.

⦁ Nixxiegħa ottika

Dan biex jiġi deċiż, għal kull punt fl-istampa, kif dak il-punt qed jiċċaqlaq komparattiv mal-pjan stampa, jiġifieri, il-moviment evidenti tiegħu. Dan il-moviment huwa riżultat kemm ta 'kif il-punt 3D ta' tqabbil qed jiċċaqlaq fix-xena kif ukoll kif il-kamera qed tiċċaqlaq komparattivament max-xena.

⦁ Remaking tax-xena

Mogħtija waħda jew (normalment) aktar stampa ta' xena, jew vidjow, ir-riproduzzjoni tax-xena timmira li tirreġistra mudell 3D tax-xena. Fl-eħfef każ il-mudell jista 'jkun mazz ta' fokus 3D. Strateġiji aktar raffinati jipproduċu mudell tal-wiċċ 3D totali

⦁ Bini mill-ġdid tal-immaġni

Il-punt tal-bini mill-ġdid tal-istampa huwa l-evakwazzjoni tal-kommossjoni (clamor tas-sensuri, moviment oskura, eċċ) minn stampi. Il-metodoloġija konċepibbli l-inqas kumplessa għat-tkeċċija ta 'kommozzjoni hija tipi differenti ta' kanali, pereżempju, kanali low-pass jew kanali tan-nofs. Strateġiji aktar moderni jistennew mudell ta' kif jixbħu l-istrutturi tal-istampa tal-viċinat, mudell li jagħrafhom mill-kommozzjoni. Billi l-ewwel tinvestiga l-informazzjoni ta 'l-istampa fi żmien pjuttost twil ta' l-istrutturi ta 'l-istampa fil-qrib, per eżempju, linji jew truf, u wara tikkontrolla s-separazzjoni dipendenti fuq id-data tal-viċinat mill-pass ta' l-eżami, grad superjuri ta 'evakwazzjoni ta' kommozzjoni huwa ġeneralment miksub ma 'l-inqas. metodoloġiji kumplessi. Mudell f’dan il-qasam hija l-pittura tagħhom. Ftit oqfsa huma applikazzjonijiet indipendenti li jindirizzaw kwistjoni partikolari ta’ stima jew rikonoxximent, filwaqt li oħrajn jinkludu sub-arranġament ta’ pjan ikbar li, pereżempju, fih ukoll sub-oqfsa għall-kontroll ta’ attwaturi mekkaniċi, arranġament, bażijiet ta’ informazzjoni tad-dejta, man- interfaces tal-magni, eċċ. L-eżekuzzjoni partikolari ta 'qafas ta' viżjoni tal-PC tiddependi bl-istess mod fuq jekk l-utilità tiegħu hijiex determinata minn qabel jew jekk xi biċċa minnu tista 'titgħallem jew tiġi aġġustata tajjeb ħafna waqt l-attività. Hemm, kemm jista 'jkun, kapaċitajiet regolari li jinsabu fil-viżjoni PC numerużi