Pam mae adnabod delwedd yn bwysig?

Mae tua 80% o'r sylwedd ar y we yn weledol. Byddech eisoes yn gallu dechrau gweithio allan pam y gallai labelu lluniau ddal ei le fel arglwydd y tabl sylweddau. Ni waeth a yw'n bobl neu'n sefydliadau, mae cydnabyddiaeth delwedd AI wedi ei gwneud hi'n bosibl gwahaniaethu delweddau ar-lein â gwrthrych di-nod. Mae tua 657 biliwn o ffotograffau yn cael eu postio'n ofalus bob blwyddyn, gyda'r rhan fwyaf yn ymddangos trwy gyfryngau ar-lein. Darn gweddus o'r lluniau hynny yw unigolion sy'n symud eitemau ymlaen, ni waeth a ydynt yn gwneud hynny'n ddamweiniol ai peidio. Mae cynnwys a gynhyrchir gan gleientiaid (UGC) yn ei strwythur mwyaf perffaith yn ddylanwad grymusol gwych i frandiau gan ei fod yn rhoi'r math mwyaf delfrydol o ddatblygiad.

Mae yna ddyfeisiadau hysbysebu i ddychryn sefydliadau pan fydd hysbysiad prynwr trwy gyfryngau ar-lein, fodd bynnag oni ddylid dweud rhywbeth am pan fydd datblygiad brandiau'n digwydd heb i unrhyw un labelu eu henw yn y post cymdeithasol? Dyma'r man lle mae cydnabyddiaeth delwedd AI yn dangos ei werth. Ar y siawns i ffwrdd bod y dechnoleg yn cael ei gofalu am y setiau data cywir, gall AI wahaniaethu rhwng llun heb label penodol yn cyfeirio ato. Mae'r canlyniadau'n bwysig i frandiau olrhain a dilyn eu hysbysiadau cymdeithasol.

Sut mae adnabod delwedd yn gweithio?

Fel y gwyddom mae'n debyg, gall AI edrych trwy gamau cyfryngau ar y we gan chwilio am ffotograffau a'u cyferbynnu â chasgliadau gwybodaeth eang. Ar y pwynt hwnnw mae'n dewis llun perthnasol sy'n cyfateb ar gyfradd lawer cyflymach nag y gall pobl ei wneud. Mae brandiau'n defnyddio cydnabyddiaeth lluniau i ddarganfod cynnwys fel eu rhai eu hunain trwy gyfryngau ar y we. Mae hynny'n awgrymu gwahaniaethu logo brand neu ganfod sefyllfa eitem wedi'i lleoli'n naturiol ymhlith cleientiaid cyfryngau ar y we. Mae gofyn i bobl bysgota trwy gymaint o ddata yn effeithiol yn mynd yn flinedig. Nid yw cudd-wybodaeth efelychiedig yn pwysleisio'r gwall dynol, ac mae'n dychwelyd union ganlyniadau ar lefelau heb eu hail. Mae cydnabyddiaeth llun deallusrwydd artiffisial yn sgrinio'r hyn y mae unigolion yn ei ddweud am frand heb yr angen am destun. Bydd brandiau sy'n barod i ddilyn eu hysbysiadau cymdeithasol heb gleientiaid yn disgwyl teipio enw'r sefydliad yn dirwyn i ben mewn sefyllfa amhrisiadwy. Mae'r posibilrwydd i fanteisio ar eu cynhwysiant ar-lein eu hunain yn unig trwy ddynodwyr canfyddedig AI yn aruthrol ac yn cynnig cynhwysiant heb ei ail.

Dyma rai negeseuon cyffredin o adnabod delweddau:-

O'r cychwyn cyntaf mae angen i ni benderfynu a yw'r wybodaeth llun yn cynnwys rhyw erthygl, uchafbwynt, neu symudiad penodol. Yn nodweddiadol, gellir mynd i'r afael â'r aseiniad hwn yn galonog a heb ymdrech gan ddyn, ond eto nid yw wedi'i drin yn ddigonol yng ngolwg PC ar gyfer yr achos cyffredinol: erthyglau hunan-bendant mewn amgylchiadau dewisol. Mae’n well mynd i’r afael â’r technegau presennol ar gyfer rheoli’r mater hwn ar gyfer erthyglau penodol yn unig, er enghraifft, eitemau mathemategol sylfaenol (e.e., aml-hedrol), wynebau dynol, cymeriadau wedi’u hargraffu neu eu trawsgrifio, neu gerbydau, ac mewn amgylchiadau penodol, eu portreadu cyn belled ag y bo modd. o gwmpas nodweddu disgleirdeb, sylfaen, ac osgo yr eitem o'i gymharu â'r camera. Portreadir amrywiaethau amrywiol o’r mater cydnabod yn yr ysgrifen:

• Adnabod gwrthrychau

Gellir dirnad un neu ychydig o erthyglau neu ddosbarthiadau eitem a bennwyd ymlaen llaw neu a ddysgwyd, fel arfer ynghyd â'u sefyllfaoedd 2D yn y llun neu ystumiau 3D yn yr olygfa.

• Adnabod

Canfyddir achos unigol o erthygl. Mae modelau yn brawf gwahaniaethol o wyneb unigolyn penodol neu farc unigryw, neu ID cerbyd penodol.

• Canfod

Mae'r wybodaeth llun yn cael ei archwilio ar gyfer cyflwr penodol. Modelau yw darganfod celloedd neu feinweoedd rhyfedd posibl mewn lluniau clinigol neu adnabod cerbyd mewn fframwaith cost stryd wedi'i raglennu. Mae darganfyddiad sy'n dibynnu ar gyfrifiadau gweddol syml a chyflym yn cael ei ddefnyddio yma ac acw i ddod o hyd i ardaloedd mwy cymedrol o wybodaeth lluniau diddorol y gellir eu torri i lawr hefyd trwy ofyn am strategaethau mwy cyfrifiannol i greu cyfieithiad cywir.

Mae ychydig o ymrwymiadau penodol sy'n dibynnu ar gydnabyddiaeth yn bodoli, er enghraifft,

• Adfer llun yn seiliedig ar gynnwys

Yma darganfod pob llun mewn trefniant mwy o luniau sydd â sylwedd arbennig. Gellir pennu'r sylwedd mewn ffordd annisgwyl, er enghraifft cyn belled â'i fod yn debyg i lun gwrthrychol o'i gymharu (rhowch lun i mi fel llun X), neu cyn belled â'r safonau dilyn lefel sylweddol a roddir fel mewnbwn testun (rhowch bob llun i mi sy'n cynnwys nifer fawr tai, yn cael eu cymeryd yn ystod y gaeaf, ac heb gerbydau ynddynt).

• Posibilrwydd asesiad

mae angen i ni fesur lleoliad neu gyfeiriad erthygl benodol o'i gymharu â'r camera. Byddai cais enghreifftiol ar gyfer y strategaeth hon yn helpu robot i adennill eitemau o linell gludo mewn amgylchiadau system gynhyrchu fecanyddol.

• Cydnabod cymeriad optegol

OCR sy'n gwahaniaethu cymeriadau mewn lluniau o gynnwys wedi'i argraffu neu wedi'i ysgrifennu â llaw, yn bennaf gyda'r nod terfynol o amgodio'r cynnwys mewn sefydliad yn fwy a'i rymuso i addasu neu archebu Adran Cyfrifiadureg a Pheirianneg, Prifysgol Talaith Michigan. Crëir strategaethau i ganfod gwrthrychau, i ddarganfod pa rai o'u huchafbwyntiau sy'n eu hadnabod gan eraill, ac i gynllunio cyfrifiadau y gall peiriant eu defnyddio i wneud y cymeriadu. Mae cymwysiadau sylweddol yn cynnwys cydnabyddiaeth wyneb, prawf adnabyddadwy argraff bys, archwiliad llun cofnod, datblygiad model erthygl 3D, llwybr robotiaid, a chynrychioliad / ymchwiliad i wybodaeth gyfeintiol 3D. Mae materion ymchwil trai a thrai yn ymgorffori cadarnhad biometrig, arsylwi a dilyn wedi'i raglennu, HCI di-law, arddangos wynebau, dyfrnodi cyfrifiadurol ac archwilio dyluniad archifau ar-lein. Mae cyn-fyfyrwyr hwyr y labordy wedi delio â chydnabod penseiri, gwirio llofnod, dysgu gweledol, ac adfer lluniau.”

model:

Dylem weld ei bod yn cymryd yn syfrdanol cwpl o bicseli o ddata i gael yr opsiwn i adnabod gwrthrych llun, yn ôl grŵp a yrrwyd gan arbenigwr MIT. Gallai'r datguddiad ysgogi datblygiadau rhyfeddol yn y prawf mecanyddol adnabyddadwy o luniau ar-lein ac, o'r diwedd, rhoi rhagosodiad i gyfrifiaduron personol weld fel y mae pobl yn ei wneud. Byddai cyflwyno portread arbennig o fyr yn gam sylweddol ymlaen tuag at ei gwneud yn bosibl rhestru'r biliynau o luniau ar y Rhyngrwyd o ganlyniad. Ar hyn o bryd, mae'r dulliau unigol o chwilio am luniau yn dibynnu ar arysgrifau cynnwys y mae unigolion wedi'u cofnodi â llaw ar gyfer pob delwedd, ac mae angen data o'r fath ar nifer o luniau. Yn yr un modd, byddai dull adnabod wedi'i raglennu'n rhoi dull o ddefnyddio lluniau ffeil y mae unigolion yn eu llwytho i lawr o gamerâu cyfrifiadurol i'w cyfrifiaduron personol, heb brofi ac is-deitlo pob un â llaw. Hefyd, o'r diwedd, fe allai ysgogi gwir olwg peiriant, a allai weithiau ganiatáu i robotiaid roi trefn ar y wybodaeth sy'n dod o'u camerâu a threfnu ble maen nhw. gwneud allan o erthygl debyg yn gyffredinol, mewn trefniant tebyg yn gyffredinol.” Os yw un llun wedi bod yn gysylltiedig ag arysgrif neu deitl, ar y pwynt hwnnw mae'n debyg y byddai lluniau gwahanol sy'n cydlynu ei god mathemategol yn dangos eitem debyg, (er enghraifft, cerbyd, coeden, neu unigolyn) felly gall yr enw sy'n gysylltiedig ag un llun fod. symud i'r lleill. “Gyda llawer iawn o luniau, gall hyd yn oed cyfrifiadau syml yn gyffredinol berfformio'n wirioneddol dda” wrth adnabod lluniau felly.

⦁ Cydnabyddiaeth Wyneb

rydym yn sylweddoli bod fframweithiau cydnabod wynebau yn dod yn enwog yn barhaus fel dulliau o gael gwared ar ddata biometrig. Mae cydnabyddiaeth wyneb yn rhan sylfaenol o fframweithiau biometrig ac mae'n ddeniadol i wahanol gymwysiadau gan gynnwys rhagchwilio gweledol a diogelwch. Yng ngoleuni cydnabyddiaeth gyffredinol y boblogaeth o luniau wyneb ar wahanol adroddiadau, mae gan gydnabyddiaeth wyneb botensial anhygoel i droi i mewn i arloesi biometrig blaengar o benderfyniad.

Systemau Adnabod Llun

⦁ Arholiad cynnig

Mae rhai aseiniadau'n uniaethu ag asesiad symudiad lle mae dilyniant llun yn cael ei baratoi i greu medrydd o'r cyflymder naill ai ym mhob ffocws yn y llun neu yn yr olygfa 3D, neu hyd yn oed y camera sy'n cyflwyno'r lluniau . Dyma enghreifftiau o aseiniadau o’r fath:

⦁ Symudiad ego

Penderfynu ar symudiad anhyblyg 3D (colyn a dehongliad) y camera o ddilyniant llun a grëwyd gan y camera.

⦁ Olrhain

Bydd y canlynol yn dilyn y datblygiadau o (yn gyffredinol) trefniant mwy cymedrol o ddiddordeb yn canolbwyntio neu brotestiadau (ee, cerbydau neu bobl) yn yr olyniaeth llun.

⦁ Ffrwd optegol

Mae hyn i benderfynu, ar gyfer pob pwynt yn y llun, sut mae'r pwynt hwnnw'n symud o'i gymharu â'r awyren llun, hy, ei symudiad amlwg. Mae'r symudiad hwn yn ganlyniad i sut mae'r pwynt cymharu 3D yn symud yn yr olygfa a sut mae'r camera'n symud o'i gymharu â'r olygfa.

⦁ Ail-wneud golygfa

O gael un neu (fel arfer) mwy o luniau o olygfa, neu fideo, mae atgynhyrchu golygfa yn targedu cofrestru model 3D o'r olygfa. Yn yr achos hawsaf gall y model fod yn griw o ffocws 3D. Mae strategaethau mwy mireinio yn cynhyrchu model arwyneb 3D cyfan

⦁ Ailadeiladu delwedd

Pwynt ailadeiladu llun yw gwacáu cynnwrf (clamor synhwyraidd, symudiad aneglur, ac yn y blaen) o luniau. Y fethodoleg leiaf cymhleth bosibl ar gyfer diarddel cwmwd yw gwahanol fathau o sianeli, er enghraifft, sianeli pas-isel neu sianeli canol. Mae strategaethau mwy modern yn disgwyl model o sut mae strwythurau darluniau cymdogaeth yn ymdebygu, model sy'n eu hadnabod o'r cynnwrf. Trwy ymchwilio'n gyntaf i'r wybodaeth llun mewn cryn dipyn o'r strwythurau llun cyfagos, er enghraifft, llinellau neu ymylon, ac wedi hynny rheoli'r gwahanu sy'n dibynnu ar ddata cymdogaeth o'r cam arholiad, mae gradd uwch o wacáu rhag cynnwrf yn cael ei gyferbynnu'n gyffredinol â'r lleiaf. methodolegau cymhleth. Model yn y maes hwn yw eu paentiad. Mae rhai fframweithiau yn gymwysiadau annibynnol sy’n mynd i’r afael â mater amcangyfrif neu gydnabyddiaeth benodol, tra bod eraill yn cynnwys is-drefniant o gynllun mwy sydd, er enghraifft, yn yr un modd yn cynnwys is-fframweithiau ar gyfer rheoli actiwadyddion mecanyddol, trefnu, cronfeydd gwybodaeth data, dyn- rhyngwynebau peiriant, ac yn y blaen Mae gweithrediad penodol fframwaith gweledigaeth PC yn yr un modd yn dibynnu ar a yw ei ddefnyddioldeb wedi'i bennu ymlaen llaw neu os gellir dysgu neu addasu rhywfaint ohono yn dda iawn yn ystod gweithgaredd. Mae yna, fel y bo, alluoedd rheolaidd sydd i'w cael mewn nifer o olwg PC