Nganong importante ang pag-ila sa imahe?

Mga 80% sa substansiya sa web kay biswal. Makasugod ka na sa pagtrabaho kung ngano nga ang pag-label sa litrato mahimo’g maghupot sa lugar niini ingon ang ginoo sa lamesa sa substansiya. Dili igsapayan kung kini mga tawo o mga organisasyon, ang pag-ila sa imahe sa AI naghimo nga mahunahuna nga mailhan ang mga biswal sa online nga adunay gamay nga butang. Adunay mga 657 bilyon nga mga litrato nga gi-post matag tuig nga mabinantayon, nga ang mas dako nga bahin nagpakita pinaagi sa online media. Ang usa ka desente nga piraso sa mga litrato mao ang mga indibidwal nga nag-abante sa mga butang, bisan kung wala nila kini gibuhat nga wala tuyoa. Ang sulud nga gihimo sa kliyente (UGC) sa labing perpekto nga istruktura niini usa ka maayo nga impluwensya sa paghatag gahum alang sa mga tatak tungod kay naghatag kini labing maayo nga klase sa pag-uswag.

Adunay mga himan sa pag-anunsyo aron maalarma ang mga organisasyon kung adunay usa ka pahibalo sa pumapalit pinaagi sa online media, apan dili ba kinahanglan nga isulti kung kanus-a mahitabo ang pag-uswag sa mga tatak nga wala’y bisan kinsa nga nagbutang sa ilang ngalan sa post sa sosyal? Kini ang dapit diin ang AI image recognition nagpakita sa bili niini. Kung ang teknolohiya giatiman sa husto nga mga datos, mahimo’g mailhan sa AI ang usa ka litrato nga wala’y klaro nga label nga gitumong. Ang mga sangputanan hinungdanon alang sa mga tatak aron masubay ug sundon ang ilang mga pahibalo sa sosyal.

Giunsa pagtrabaho ang pag-ila sa imahe?

Sama sa nahibal-an namon nga ang AI mahimong motan-aw sa mga yugto sa media nga nakabase sa web nga nangita alang sa mga litrato ug itandi kini sa daghang mga koleksyon sa kasayuran. Niana nga punto nagpili sa angay nga litrato nga motugma sa usa ka rate nga labi ka dali kaysa mahimo sa mga tawo. Gigamit sa mga tatak ang pag-ila sa litrato aron madiskubre ang sulud sama sa ilang kaugalingon pinaagi sa media nga nakabase sa web. Nagpasabot kana sa pag-ila sa logo sa usa ka brand o sa pagtan-aw sa natural nga posisyon sa butang nga sitwasyon sa mga kliyente sa media nga nakabase sa web. Ang paghangyo nga ang mga tawo mangisda pinaagi sa ingon kadaghan nga datos epektibo nga makapakapoy. Ang simulate nga paniktik wala maghatag gibug-aton sa sayup sa tawo, ug gibalik ang eksaktong mga sangputanan sa dili hitupngan nga lebel. Ang artificial intelligence picture acknowledgement screens kung unsa ang gisulti sa mga indibidwal bahin sa usa ka brand nga wala kinahanglana ang text. Ang mga tatak nga andam sa pagsunod sa ilang sosyal nga mga pahibalo nga wala ang mga kliyente nga nagpaabut nga i-type ang ngalan sa organisasyon maabut sa usa ka hinungdanon nga posisyon. Ang posibilidad nga mapahimuslan ang ilang kaugalingon nga paglakip sa online nga eksklusibo pinaagi sa nahibal-an nga mga identifier sa AI dako kaayo ug nagtanyag dili hitupngan nga paglakip.

Ania ang pipila ka sagad nga buluhaton sa pag-ila sa imahe: -

Gikan sa sinugdan kita kinahanglan nga magdesisyon kung ang impormasyon sa litrato adunay usa ka partikular nga artikulo, highlight, o paglihok. Kini nga buluhaton kasagarang matubag nga kinasingkasing ug walay pagpaningkamot sa usa ka tawo, bisan pa dili pa igo nga nasulbad sa panan-awon sa PC alang sa kinatibuk-ang kaso: mga artikulo nga nagsalig sa kaugalingon sa mga kahimtang nga gusto. Ang kasamtangang mga teknik sa pagdumala niini nga isyu mahimong labing maayo nga sulbaron para lang sa klaro nga mga artikulo, pananglitan, batakang matematika nga mga butang (pananglitan, polyhedral), nawong sa tawo, giimprinta o gi-transcribe nga mga karakter, o mga sakyanan, ug sa dayag nga mga sirkumstansya, kasagarang gihulagway sa tanan. palibot nga gihulagway nga kahayag, pundasyon, ug postura sa butang nga itandi sa camera. Ang lainlaing mga klase sa isyu sa pag-ila gihulagway sa pagsulat:

• Pag-ila sa butang

Ang usa o pipila ka gitino nang daan o nakat-onan nga mga artikulo o mga klase sa butang mahimong masabtan, kasagaran uban sa ilang 2D nga mga sitwasyon sa hulagway o 3D nga mga postura sa talan-awon.

• Pag-ila

Usa ka indibidwal nga kaso sa usa ka artikulo ang gitan-aw. Ang mga modelo mao ang pag-ila sa pamatuod sa nawong sa usa ka partikular nga indibidwal o talagsaon nga marka, o ID sa usa ka partikular nga sakyanan.

• Deteksiyon

Ang impormasyon sa hulagway gisusi alang sa usa ka partikular nga kondisyon. Ang mga modelo mao ang pagkadiskobre sa mahunahunaan nga katingad-an nga mga selula o mga tisyu sa mga klinikal nga hulagway o pag-ila sa usa ka sakyanan sa usa ka naprograma nga gambalay sa gasto sa kadalanan. Ang pagdiskubre nga nagsalig sa kasarangan nga prangka ug dali nga mga kalkulasyon dinhi ug didto gigamit alang sa pagpangita sa labi ka kasarangan nga mga distrito sa makaiikag nga impormasyon sa litrato nga mahimo usab nga mabungkag pinaagi sa labi ka kalkulasyon nga paghangyo nga mga estratehiya aron makahimo usa ka husto nga paghubad.

Adunay pipila ka partikular nga mga buluhaton nga nagsalig sa pag-ila, pananglitan,

• Content-based nga hulagway recovery

Dinhi makit-an ang tanan nga mga litrato sa usa ka mas dako nga kahikayan sa mga litrato nga adunay usa ka partikular nga sangkap. Ang substansiya mahimong matino sa wala damha nga paagi, pananglitan sa pagkaparehas sa usa ka tumong nga hulagway (ihatag kanako ang tanang mga hulagway sama sa hulagway X), o kutob sa mahinungdanon nga lebel sa mga sumbanan sa pagpangita nga gihatag isip text input (hatagi ako sa tanang mga hulagway nga adunay daghan mga balay, gikuha panahon sa tingtugnaw, ug walay mga sakyanan diha kanila).

• Pose assessment

kinahanglan natong sukdon ang posisyon o direksyon sa usa ka partikular nga artikulo nga itandi sa camera. Ang usa ka modelo nga aplikasyon alang niini nga estratehiya makatabang sa usa ka robot sa pagbawi sa mga butang gikan sa linya sa transportasyon sa usa ka mekanikal nga sistema sa produksiyon nga kahimtang.

• Pag-ila sa kinaiya sa optikal

Ang OCR nga mao ang pag-ila sa mga karakter sa mga hulagway sa giimprinta o mano-mano nga sinulat nga sulod, alang sa kadaghanan nga adunay katapusan nga tumong sa pag-encode sa sulod sa usa ka organisasyon nga labaw pa ug paghatag gahum sa pag-usab o pag-order sa Departamento sa Computer Science ug Engineering, Michigan State University. Gibuhat ang mga estratehiya aron makit-an ang mga butang, aron mahibal-an kung kinsa sa ilang mga highlight ang makaila niini gikan sa uban, ug magplano sa mga kalkulasyon nga magamit sa usa ka makina aron mahimo ang pagkilala. Mahinungdanon nga mga aplikasyon naglakip sa pag-ila sa nawong, impresyon sa tudlo nga mailhan nga pruweba, pagsusi sa litrato sa rekord, pag-uswag sa modelo sa 3D nga artikulo, ruta sa robot, ug representasyon / imbestigasyon sa 3D volumetric nga impormasyon. Ang ebb ug flow research nga mga isyu naglakip sa biometric confirmation, programmed observation and following, handless HCI, face displaying, computerized watermarking ug pagsusi sa disenyo sa online archives. Ang mga ulahi nga alumni sa lab nag-atubang sa pag-ila sa penmanship, pagsusi sa pirma, pagkat-on sa biswal, ug pagbawi sa litrato.

Modelo:

Kinahanglan natong tan-awon nga gikinahanglan ang makapakurat nga pipila ka mga pixel sa datos aron adunay kapilian sa pag-ila sa hilisgutan sa usa ka hulagway, usa ka grupo nga gimaneho sa usa ka MIT nga espesyalista ang nakit-an. Ang pagpadayag mahimo’g mag-aghat sa talagsaon nga pag-uswag sa mekanikal nga mailhan nga pruweba sa mga litrato sa online ug, sa katapusan, maghatag usa ka premyo sa mga PC nga makita sama sa gibuhat sa mga tawo. Ang pag-ihap sa usa ka mubo nga paghulagway mahimong usa ka hinungdanon nga pag-uswag sa paghimo nga mahunahuna nga imbentaryo ang binilyon nga mga litrato sa Internet nga sangputanan. Sa pagkakaron, ang nag-inusarang paagi sa pagpangita og mga hulagway nagdepende sa mga inskripsiyon sa sulod nga gisulod sa mga indibidwal pinaagi sa kamot alang sa matag hulagway, ug daghang mga hulagway ang nagkinahanglan sa maong datos. Ang Programmed ID maghatag usab ug paagi sa pag-file sa mga hulagway nga gi-download sa mga tawo gikan sa mga computerized camera ngadto sa ilang mga PC, nga walay kasinatian ug subtitle matag usa pinaagi sa kamot. Usab, sa katapusan kini makaaghat sa tinuod nga panan-awon sa makina, nga usahay makatugot sa mga robot sa paghan-ay sa impormasyon nga gikan sa ilang mga kamera ug paghan-ay kon asa sila. gihimo gikan sa kasagarang susamang artikulo, sa kasagaran susamang kahikayan.” Kon ang usa ka hulagway nalangkit sa usa ka inskripsiyon o titulo, nianang puntoha ang lain-laing mga hulagway nga nag-coordinate sa mathematical code niini lagmit magpakita ug susamang butang, (pananglitan, usa ka sakyanan, kahoy, o indibidwal) busa ang ngalan nga nalangkit sa usa ka hulagway mahimong mibalhin sa uban. "Uban sa hilabihan ka daghan nga mga hulagway, bisan sa kasagaran nga prangka nga mga kalkulasyon makahimo sa tinuod nga maayo" sa pag-ila sa mga hulagway sa ingon niana.

⦁ Pag-ila sa nawong

naamgohan namo nga ang mga framework sa pag-ila sa nawong padayon nga nahimong sikat isip mga pamaagi sa pagtangtang sa biometric data. Ang pag-ila sa nawong adunay sukaranan nga bahin sa biometric nga mga balangkas ug madanihon alang sa lainlaing mga aplikasyon lakip ang visual reconnaissance ug seguridad. Tungod sa kinatibuk-ang pag-ila sa populasyon sa mga hulagway sa nawong sa lain-laing mga taho, ang pag-ila sa nawong adunay usa ka talagsaon nga potensyal nga mahimong pinakabag-o nga biometric nga pagbag-o sa desisyon.

Mga Sistema sa Pag-ila sa Hulagway

⦁ Pagsusi sa paglihok

Ang pipila ka mga buluhaton nagpaila sa pagtan-aw sa paglihok kung diin ang sunod-sunod nga litrato giandam aron makahimo usa ka gauge sa katulin sa matag naka-focus sa litrato o sa 3D nga eksena, o bisan sa camera nga naghatud sa mga litrato. Ang mga pananglitan sa maong mga buluhaton mao ang:

⦁ Kalihokan sa ego

Pagdesisyon sa 3D inflexible nga kalihukan (pivot ug interpretation) sa camera gikan sa sunodsunod nga hulagway nga gihimo sa camera.

⦁ Pagsubay

Ang mosunod mao ang pagsunod sa mga kalamboan sa usa ka (sa kinatibuk-an) nga mas kasarangan nga paghan-ay sa mga focus sa interes o mga protesta (pananglitan, mga sakyanan o mga tawo) sa sunod-sunod nga hulagway.

⦁ Optical nga sapa

Kini mao ang pagdesisyon, alang sa matag punto sa hulagway, sa unsa nga paagi kana nga punto naglihok nga itandi sa hulagway nga eroplano, ie, ang dayag nga paglihok niini. Kini nga paglihok usa ka sangputanan kung giunsa ang pagtandi sa 3D nga punto naglihok sa talan-awon ug kung giunsa ang paglihok sa camera nga itandi sa talan-awon.

⦁ Pag-remake sa talan-awon

Gihatag ang usa o (kasagaran) dugang nga mga litrato sa usa ka talan-awon, o usa ka video, ang mga target sa pagkopya sa eksena nga nagparehistro sa usa ka 3D nga modelo sa talan-awon. Sa pinakasayon ​​nga kaso ang modelo mahimong usa ka hugpong sa 3D nga mga focus. Ang mas dalisay nga mga estratehiya makamugna og total nga 3D surface model

⦁ Pagtukod pag-usab sa imahe

Ang punto sa pagtukod pag-usab sa hulagway mao ang pagbakwit sa kaguliyang (sensor clamor, lihok dili klaro, ug uban pa) gikan sa mga hulagway. Ang labing gamay nga komplikado nga mahunahuna nga pamaagi alang sa pagpalagpot sa kaguliyang mao ang lain-laing mga matang sa mga agianan, pananglitan, mga low-pass nga mga agianan o tunga nga mga agianan. Ang mas modernong mga estratehiya nagpaabot ug usa ka modelo kon sa unsang paagi ang mga estraktura sa hulagway sa kasilinganan susama, usa ka modelo nga makaila kanila gikan sa kaguliyang. Pinaagi sa una nga pag-imbestigar sa impormasyon sa hulagway sa makadiyot sa duol nga mga estraktura sa hulagway, pananglitan, mga linya o mga ngilit, ug pagkahuman sa pagkontrolar sa pagbulag nga nagsalig sa datos sa kasilinganan gikan sa lakang sa eksaminasyon, ang usa ka labaw nga ang-ang sa kaguliyang pagbakwit sa kasagaran makuha nga itandi sa dili kaayo. komplikado nga mga pamaagi. Usa ka modelo niini nga natad mao ang ilang pagpintal. Ang pipila ka mga balangkas kay independente nga mga aplikasyon nga nagtubag sa usa ka partikular nga pagbanabana o isyu sa pag-ila, samtang ang uban naglangkob sa usa ka sub-arrangement sa usa ka mas dako nga plano nga, pananglitan, adunay usab mga sub-frameworks alang sa pagkontrol sa mga mekanikal nga actuator, paghan-ay, mga base sa impormasyon sa datos, man- mga interface sa makina, ug uban pa Ang partikular nga pagpatuman sa usa ka balangkas sa panan-awon sa PC nagsalig usab kung ang kapuslanan niini gitino nang daan o kung ang pipila ka bahin niini mahimo’g mahibal-an o mabag-o sa panahon sa kalihokan. Adunay, bisan unsa pa, regular nga mga kapasidad nga makita sa daghang panan-awon sa PC