Nganong importante ang pag-ila sa imahe?

Mga 80 porsyento sa sulod sa internet kay biswal. Mahimo ka na magsugod sa pagtrabaho kung ngano nga ang pag-tag sa imahe mahimo’g maghupot sa lugar niini ingon hari sa lamesa sa sulud. Indibidwal man o kompanya, ang pag-ila sa imahe sa AI nagpaposible nga mailhan ang mga biswal online nga adunay gamay nga kasamok. Adunay mga 657 bilyon nga mga litrato nga gi-post matag tuig nga digital, nga ang kadaghanan makita sa social media. Ang usa ka maayo nga tipik sa mga imahe mao ang mga tawo nga nagpasiugda sa mga produkto, bisan kung gibuhat nila kini nga wala tuyoa. Ang sulud nga hinimo sa gumagamit (UGC) sa labing puro nga porma usa ka maayo kaayo nga pagpaandar alang sa mga tatak tungod kay naghatag kini labing kaayo nga klase sa promosyon.
Adunay mga himan sa pagpamaligya aron maalerto ang mga kompanya kung adunay paghisgot sa mga konsumedor sa social media, apan komosta kung ang promosyon sa mga tatak mahitabo nga wala’y nag-tag sa ilang ngalan sa post sa sosyal? Dinhi diin ang pag-ila sa imahe sa AI nagpamatuod sa kantidad niini. Kung ang teknolohiya gipakaon sa husto nga mga dataset, ang AI makaila sa usa ka imahe nga walay piho nga paghisgot sa tag. Ang mga resulta hinungdanon alang sa mga tatak aron masubay ug masubay ang ilang mga paghisgot sa sosyal.

Giunsa pagtrabaho ang pag-ila sa imahe?

Sama sa nahibal-an namon ang AI makapangita sa mga platform sa social media nga nangita mga litrato ug itandi kini sa daghang mga set sa datos. Dayon kini modesisyon sa may kalabutan nga hulagway nga motakdo sa gikusgon nga mas paspas kay sa mahimo sa tawo. Gigamit sa mga tatak ang pag-ila sa imahe aron makit-an ang sulud nga parehas sa ilang kaugalingon sa social media. Kana nagpasabut nga pag-ila sa logo sa usa ka brand o pag-ila sa organikong gibutang nga pagbutang sa produkto taliwala sa mga tiggamit sa social media. Ang paghangyo sa mga tawo sa pagpangita sa daghang impormasyon dali nga mahimong kapoy. Ang AI wala mabalaka bahin sa sayup sa tawo, ug gibalik ang tukma nga mga resulta sa dili hitupngan nga lebel. Ang pag-ila sa imahe sa AI nagmonitor kung unsa ang gisulti sa mga tawo bahin sa usa ka brand nga wala kinahanglana ang teksto. Ang mga tatak nga makahimo sa pagsubay sa ilang mga sosyal nga paghisgot nga wala’y mga tiggamit nga kinahanglan nga i-type ang ngalan sa kompanya makit-an ang ilang kaugalingon sa usa ka mapuslanon nga posisyon. Ang potensyal sa pag-tap sa ilang kaugalingon nga online coverage pinaagi lamang sa AI nga giila nga mga identifier dako ug nagtanyag og dili hitupngan nga coverage.

Ania ang pipila ka kasagarang buluhaton sa pag-ila sa imahe:-

Sa una kinahanglan naton mahibal-an kung ang datos sa imahe adunay usa ka piho nga butang, bahin, o kalihokan. Kini nga buluhaton kasagarang masulbad nga lig-on ug walay paningkamot sa usa ka tawo, apan dili gihapon makatagbaw nga masulbad sa computer vision alang sa kinatibuk-ang kaso: arbitraryong mga butang sa arbitraryong mga sitwasyon. Ang kasamtangan nga mga pamaagi sa pag-atubang niini nga problema mahimong labing maayo nga masulbad lamang alang sa piho nga mga butang, sama sa yano nga geometriko nga mga butang (pananglitan, polyhedra), nawong sa tawo, giimprinta o sinulat sa kamot nga mga karakter, o mga sakyanan, ug sa piho nga mga sitwasyon, kasagaran gihulagway sa mga termino. sa maayo nga pagkahubit nga kahayag, background, ug pose sa butang nga may kalabotan sa camera. Ang lainlaing mga lahi sa problema sa pag-ila gihulagway sa literatura:

• Pag-ila sa butang

Usa o ubay-ubay nga pre-specified o nakat-unan nga mga butang o mga klase sa butang mahimong mailhan, kasagaran uban sa ilang 2D nga posisyon sa imahe o 3D nga pose sa talan-awon.

• Pag-ila
Ang usa ka indibidwal nga pananglitan sa usa ka butang giila. Ang mga pananglitan mao ang pag-ila sa nawong o fingerprint sa usa ka partikular nga tawo, o pag-ila sa usa ka partikular nga sakyanan.

• Deteksiyon
Ang datos sa imahe gi-scan alang sa usa ka piho nga kahimtang. Ang mga pananglitan mao ang pag-detect sa posibleng abnormal nga mga selula o tisyu sa medikal nga mga hulagway o pag-detect sa usa ka sakyanan sa awtomatik nga sistema sa toll sa dalan. Ang pagtuki base sa medyo simple ug paspas nga mga kalkulasyon usahay gigamit alang sa pagpangita sa mas gagmay nga mga rehiyon sa makapaikag nga datos sa imahe nga mahimo pa nga tukion pinaagi sa mas daghang computationally demanding nga mga teknik aron makahimo og husto nga interpretasyon.

Adunay ubay-ubay nga espesyal nga mga buluhaton base sa pag-ila, sama sa:

• Pagkuha sa imahe nga nakabase sa sulud
Dinhi makit-an ang tanan nga mga imahe sa usa ka mas dako nga hugpong sa mga imahe nga adunay usa ka piho nga sulud. Ang sulod mahimong espesipiko sa lain-laing mga paagi, pananglitan sa mga termino sa pagkaparehas relatibo sa usa ka target nga hulagway (hatagi ako sa tanan nga mga hulagway nga susama sa hulagway X), o sa mga termino sa taas nga lebel nga mga criteria sa pagpangita nga gihatag isip text input (hatag kanako ang tanang mga hulagway nga adunay sulod. daghang mga balay, gikuha panahon sa tingtugnaw, ug walay mga sakyanan diha kanila).

• Pagbanabana sa pose
kinahanglan natong banabanaon ang posisyon o oryentasyon sa usa ka piho nga butang nga may kalabotan sa camera. Usa ka pananglitan nga aplikasyon alang niini nga teknik mao ang pagtabang sa usa ka robot sa pagkuha sa mga butang gikan sa usa ka conveyor belt sa usa ka sitwasyon sa linya sa asembliya.

• Optical nga pag-ila sa karakter
OCR nga mao ang pag-ila sa mga karakter sa mga hulagway sa giimprinta o sinulat sa kamot nga teksto, kasagaran uban sa panglantaw sa pag-encode sa teksto sa usa ka porma nga labaw pa ug makahimo sa pag-edit o pag-indeks sa Departamento sa Computer Science ug Engineering, Michigan State University. "Ang mga magtutudlo sa Pagkilala sa Pattern ug Pagproseso sa Imahe (PRIP) Lab ug mga estudyante nag-imbestiga sa paggamit sa mga makina aron mailhan ang mga pattern o mga butang. Ang mga pamaagi gihimo aron mabati ang mga butang, aron mahibal-an kung kinsa sa ilang mga bahin ang nagpalahi kanila gikan sa uban, ug sa pagdesinyo sa mga algorithm nga magamit sa usa ka makina sa paghimo sa klasipikasyon. Ang importante nga mga aplikasyon naglakip sa pag-ila sa nawong, pag-ila sa fingerprint, pagtuki sa hulagway sa dokumento, pagtukod sa modelo sa 3D nga butang, pag-navigate sa robot, ug paghanduraw / pagsuhid sa 3D volumetric nga datos. Ang mga problema karon sa panukiduki naglakip sa biometric authentication, awtomatik nga pag-monitor ug pagsubay, walay gunitanan nga HCI, pagmodelo sa nawong, digital watermarking ug pag-analisar sa istruktura sa mga online nga dokumento. Ang mga bag-ong gradwado sa lab nagtrabaho sa pag-ila sa sinulat sa kamot, pag-verify sa pirma, pagkat-on sa biswal, ug pagkuha sa imahe.

⦁ Pag-ila sa nawong
nahibal-an namon nga ang mga sistema sa pag-ila sa nawong anam-anam nga nahimong popular isip paagi sa pagkuha sa biometric nga impormasyon. Ang pag-ila sa nawong adunay usa ka kritikal nga papel sa biometric nga mga sistema ug madanihon alang sa daghang mga aplikasyon lakip ang visual surveillance ug seguridad. Tungod sa kadaghanan sa publiko nga pagdawat sa mga imahe sa nawong sa lainlaing mga dokumento, ang pag-ila sa nawong adunay dako nga potensyal nga mahimong sunod nga henerasyon nga biometric nga teknolohiya nga kapilian.

Mga Sistema sa Pag-ila sa Imahe

⦁ Pagtuki sa paglihok
Daghang mga buluhaton ang may kalabutan sa pagtantiya sa paglihok diin ang usa ka han-ay sa imahe giproseso aron makahimo og usa ka banabana sa katulin sa matag punto sa imahe o sa 3D nga talan-awon, o bisan sa camera nga naghimo sa mga imahe. Ang mga pananglitan sa maong mga buluhaton mao ang:

⦁  Ego nga paglihok
Pagdeterminar sa 3D rigid motion (pagtuyok ug paghubad) sa camera gikan sa han-ay sa hulagway nga gihimo sa camera.

⦁ Pagsubay
Ang pagsubay mao ang pagsunod sa mga lihok sa usa ka (kasagaran) mas gamay nga set sa interes nga mga punto o mga butang (pananglitan, mga sakyanan o mga tawo) sa han-ay sa hulagway.

⦁ Optical nga dagan
Kini aron mahibal-an, alang sa matag punto sa imahe, kung giunsa ang paglihok sa punto nga may kalabotan sa eroplano sa imahe, ie, ang dayag nga paglihok niini. Kini nga paglihok usa ka resulta kung giunsa paglihok sa katugbang nga 3D nga punto sa talan-awon ug kung giunsa ang paglihok sa camera kalabot sa talan-awon.

⦁ Pagtukod pag-usab sa talan-awon
Gihatag ang usa o (kasagaran) daghang mga imahe sa usa ka talan-awon, o usa ka video, ang pagtukod pag-usab sa talan-awon nagtumong sa pag-compute sa usa ka 3D nga modelo sa talan-awon. Sa pinakasimple nga kaso ang modelo mahimong usa ka set sa 3D nga mga punto. Ang mas sopistikado nga mga pamaagi makamugna ug kompletong 3D surface model

⦁ Pagpahiuli sa imahe
Ang tumong sa pagpahiuli sa imahe mao ang pagtangtang sa kasaba (sensor noise, motion blur, ug uban pa) gikan sa mga imahe. Ang pinakasimple nga posible nga pamaagi para sa pagtangtang sa kasaba mao ang lain-laing mga matang sa mga filter sama sa mga low-pass filter o median nga mga filter. Ang mas sopistikado nga mga pamaagi nagbaton ug usa ka modelo kung unsa ang hitsura sa lokal nga mga istruktura sa imahe, usa ka modelo nga nagpalahi kanila gikan sa kasaba. Pinaagi sa una nga pag-analisar sa datos sa imahe sa termino sa lokal nga mga istruktura sa imahe, sama sa mga linya o mga ngilit, ug dayon pagkontrol sa pagsala base sa lokal nga kasayuran gikan sa lakang sa pag-analisar, ang usa ka mas maayo nga lebel sa pagtangtang sa kasaba kasagarang makuha kung itandi sa mas simple nga mga pamaagi. Usa ka pananglitan niini nga natad mao ang ilang pagpintal. Ang ubang mga sistema kay stand-alone nga mga aplikasyon nga nagsulbad sa usa ka piho nga pagsukod o problema sa pagkakita, samtang ang uban naglangkob sa usa ka sub-sistema sa usa ka mas dako nga disenyo nga, pananglitan, naglangkob usab sa mga sub-sistema alang sa pagkontrol sa mekanikal nga mga actuator, pagplano, mga database sa impormasyon, man- mga interface sa makina, ug uban pa. Ang espesipikong pagpatuman sa usa ka sistema sa panan-awon sa kompyuter nagdepende usab kung ang pagpaandar niini gitakda nang daan o kung ang pipila ka bahin niini mahimong makat-unan o mabag-o sa panahon sa operasyon. Adunay, bisan pa, kasagaran nga mga gimbuhaton nga makita sa daghang mga sistema sa panan-aw sa kompyuter.

 

Mas lawom nga pagkat-on nga adunay pag-ila sa imahe

Ang pag-ila sa imahe anaa sa palibot sa wala pa ang AI. Bisan pa ang hinungdan sa pagkat-on sa makina mao ang pagbag-o sa mga pamaagi sa pag-ila sa usa ka butang o nawong sa tawo. Ang pagkat-on sa makina epektibo lamang kung adunay mga datos nga ipakaon niini, bisan pa. Alang sa tanan nga automation sa AI, ang paghimo niini aron mahibal-an ang mga imahe dili usa ka yano nga hangyo. Ang atong pagsabot sa mga biswal maoy ikaduhang kinaiya; kini usa ka butang nga giprograma namong buhaton gikan sa pagkabata. Ang pagpangutana sa parehas sa usa ka makina dili usa ka prangka nga proseso. Tungod niana nga rason, usa sa mas popular nga porma sa AI recognition mao ang convolutional neural networks (CNN). Ang CNN usa ka pamaagi nga nagtutok sa mga pixel nga nahimutang sunod sa usag usa. Ang duol nga nahimutangan nga mga hulagway mas lagmit nga may kalabutan, nga nagpasabot nga ang usa ka butang o nawong gipares sa usa ka hulagway nga adunay mas transparency.
Samtang ang mga tatak nga nagtan-aw sa pag-monetize sa social media bisan kung ang pag-ila sa imahe sa AI adunay tin-aw nga mga benepisyo, ang mga kaso sa paggamit niini labi ka lawom. Ang mga awto nga nagmaneho sa kaugalingon hapit na ang sunod nga dako nga butang sa kalibutan sa awto, ug ang teknolohiya sa pag-ila sa imahe sa AI nagtabang sa gahum niini. Ang usa ka self-driving nga awto nga makamatikod sa mga butang ug mga tawo sa karsada aron dili kini makabangga dili awtomatiko nga mahitabo. Kinahanglan nga mailhan niini ang mga imahe aron makahimo mga desisyon nga nahibal-an. Ang matag awto nga nagmaneho sa kaugalingon gisangkapan sa daghang mga sensor aron mailhan ang uban pang mga naglihok nga mga salakyanan, mga siklista, mga tawo - bisan unsa nga mahimo’g magbutang usa ka peligro. Kinahanglang iproseso sa awtomatik nga awto ang mga kapeligrohan sa dalan sama sa gihimo sa usa ka batid nga drayber. Adunay pa pipila ka mga aspeto sa pagplantsa sa dili pa ang mga self-driving nga mga sakyanan moigo sa karsada sa 2020. Apan kung ang automation sa sakyanan magsugod na, ang AI image recognition mao ang usa sa mga mayor nga drayber sa likod nila nga nagtrabaho nga luwas.
⦁ Pagkuha sa imahe
Ang usa ka digital nga imahe gihimo sa usa o daghang mga sensor sa imahe, nga, gawas sa lainlaing mga lahi sa mga light-sensitive camera, naglakip sa mga sensor sa range, tomography nga mga aparato, radar, ultra-sonic nga mga kamera, ug uban pa. Depende sa klase sa sensor, ang sangputanan nga datos sa imahe usa ka ordinaryo nga 2D nga hulagway, usa ka 3D nga gidaghanon, o usa ka han-ay sa hulagway. Ang pixel values ​​kasagaran motakdo sa kahayag intensity sa usa o pipila ka spectral bands (gray nga mga hulagway o kolor nga mga hulagway), apan mahimo usab nga may kalabutan sa lain-laing mga pisikal nga mga sukod, sama sa giladmon, pagsuyup o reflectance sa sonic o electromagnetic waves, o nuclear magnetic resonance.
⦁ Pre-pagproseso:
Sa dili pa magamit ang usa ka pamaagi sa computer vision sa datos sa imahe aron makuha ang pipila ka piho nga piraso sa kasayuran, kasagaran kinahanglan nga iproseso ang datos aron masiguro nga kini makatagbaw sa pipila nga mga pangagpas nga gipasabut sa pamaagi. Ang mga pananglitan mao ang
1. Pag-re-sampling aron masiguro nga husto ang image coordinate system.
2. Pagkunhod sa kasaba aron masiguro nga ang kasaba sa sensor dili magpaila sa sayup nga kasayuran.
3. Pagpauswag sa pagtandi aron masiguro nga ang may kalabutan nga kasayuran mahimong makit-an.
4. Scale-space representation aron mapalambo ang mga istruktura sa imahe sa lokal nga angay nga mga timbangan.
⦁ Pagkuha sa bahin:
Ang mga bahin sa imahe sa lainlaing lebel sa pagkakomplikado gikuha gikan sa datos sa imahe. Ang kasagaran nga mga pananglitan sa maong mga bahin mao ang mga linya, mga ngilit ug mga tagaytay
Lokal nga interes nga mga punto sama sa mga kanto, blobs o mga punto. Ang mas komplikado nga mga bahin mahimong may kalabutan sa texture, porma o paglihok.
⦁ Detection/segmentation:
Sa pila ka punto sa pagproseso usa ka desisyon ang gihimo bahin sa kung unsang mga punto sa imahe o mga rehiyon sa imahe ang angay alang sa dugang nga pagproseso. Ang mga pananglitan mao ang
1. Pagpili sa usa ka piho nga hugpong sa mga punto sa interes
2. Segmentasyon sa usa o daghang mga rehiyon sa imahe nga adunay usa ka piho nga butang nga interesado.
⦁ Taas nga lebel nga pagproseso:
Niini nga lakang ang input kasagaran usa ka gamay nga set sa datos, pananglitan usa ka set sa mga punto o usa ka rehiyon sa imahe nga gituohan nga adunay usa ka piho nga butang. Ang nahabilin nga pagproseso naghisgot, pananglitan:
1. Pag-verify nga ang datos makatagbaw sa modelo nga gibase sa modelo ug mga espesipiko sa aplikasyon.
2. Pagbanabana sa piho nga mga parameter sa aplikasyon, sama sa object pose o objectsize.
3. Ang pagklasipikar sa usa ka nakit-an nga butang sa lainlaing mga kategorya. Busa, ang pagproseso sa imahe makatabang sa AI sa pag-ila sa imahe ug pagtubag sumala sa pag-ila sa imahe.

Usa ka seamless nga kaugmaon sa paghanduraw

Samtang nag-uswag ang teknolohiya, ang pag-ila sa imahe magbalik labi pa nga mga sangputanan. Ulo sa Machine Learning sa Lobster, si Vladimir Pavlov nag-ingon, "Ang sukaranan sa matematika alang sa pag-ila sa butang dugay na nga naglungtad, apan ang mga posibilidad sa teknolohiya sa paggamit sa mga algorithm sa panan-aw sa kompyuter nagpakita bag-o lang. Gitugotan na sa mga neural network ang paghimo sa hingpit nga mga detector nga makahimo sa pagtrabaho nga mas maayo kaysa sa mga tawo. Ang usa ka dako nga jerk nagpugong sa presensya sa gimarkahan nga mga dataset sa imahe alang sa pagbansay, apan sa umaabot nga umaabot, dili kini usa ka problema. Ang mga inhenyero sa panan-awon sa kompyuter aktibo nga nagtrabaho sa mga algorithm sa pagkat-on sa kaugalingon". Uban sa umaabot nga labi nga naimpluwensyahan sa visual nga komunikasyon, ang pag-ila sa imahe mao ang hinungdan nga hinungdan sa daghang mga litrato nga atong makita. Pareho sa tinuod nga kinabuhi ug online.