Ինչու՞ է կարևոր պատկերի ճանաչումը:

Համացանցում առկա նյութի մոտ 80%-ը տեսողական է: Դուք արդեն կկարողանաք սկսել պարզել, թե ինչու նկարների պիտակավորումը կարող է զբաղեցնել իր տեղը որպես նյութի աղյուսակի տերը: Անկախ նրանից՝ մարդիկ են, թե կազմակերպություններ, արհեստական ​​ինտելեկտի պատկերի ճանաչումը հնարավոր է դարձրել առցանց տարբերակել վիզուալները աննշան առարկաներով: Ամեն տարի մոտ 657 միլիարդ լուսանկար տեղադրվում է խնամքով, որոնց մեծ մասը ցուցադրվում է առցանց լրատվամիջոցների միջոցով: Այդ նկարների մի պարկեշտ կտոր անհատներ են, որոնք առաջ են տանում իրերը, անկախ նրանից, թե նրանք դա պատահաբար են անում: Հաճախորդների կողմից արտադրված բովանդակությունը (UGC) իր ամենակատարյալ կառուցվածքով փայլուն հզորացնող ազդեցություն է բրենդների համար, քանի որ այն տալիս է ամենաիդեալական առաջընթացը:

Կան գովազդային սարքեր ահազանգող կազմակերպություններին, երբ կա գնորդի ծանուցում առցանց մեդիայի միջոցով, սակայն մի՞թե պետք չէ ինչ-որ բան ասել այն մասին, երբ ապրանքանիշերի առաջխաղացումը տեղի է ունենում առանց որևէ մեկի անունը նշելու սոցիալական գրառման մեջ: Սա այն վայրն է, որտեղ AI պատկերի ճանաչումը ցույց է տալիս իր արժեքը: Այն դեպքում, երբ տեխնոլոգիան հոգ է տանում տվյալների ճիշտ հավաքածուների մասին, AI-ն կարող է տարբերակել նկարը առանց հստակ պիտակի հղումների: Արդյունքները կարևոր են ապրանքանիշերի համար՝ հետևելու և հետևելու իրենց սոցիալական ծանուցումներին:

Ինչպե՞ս է աշխատում պատկերի ճանաչումը:

Ինչպես մենք հավանաբար տեղյակ ենք, AI-ն կարող է դիտել վեբ վրա հիմնված մեդիա փուլերը՝ փնտրելով լուսանկարներ և հակադրել դրանք լայն տեղեկատվական հավաքածուների հետ: Այն այդ պահին ընտրում է համապատասխան նկար, որը համընկնում է շատ ավելի արագ, քան մարդիկ կարող են անել: Բրենդներն օգտագործում են նկարների ճանաչումը՝ վեբ վրա հիմնված լրատվամիջոցների միջոցով իրենց բովանդակությունը հայտնաբերելու համար: Դա ենթադրում է տարբերակել ապրանքանիշի լոգոն կամ ընկալել իրերի բնական դիրքի իրավիճակը վեբ վրա հիմնված մեդիա հաճախորդների շրջանում: Այսքան շատ տվյալների միջոցով մարդկանցից որսալու խնդրանքն արդյունավետորեն հոգնեցնում է: Մոդելավորված ինտելեկտը չի սթրեսի ենթարկում մարդու սխալը և ճշգրիտ արդյունքներ է տալիս անզուգական մակարդակներում: Արհեստական ​​ինտելեկտի նկարների ճանաչումը ցուցադրում է այն, ինչ մարդիկ նշում են ապրանքանիշի մասին՝ առանց տեքստի պահանջի: Բրենդները, որոնք պատրաստ են հետևել իրենց սոցիալական ծանուցումներին, առանց հաճախորդների, ովքեր ակնկալում են մուտքագրել կազմակերպության անունը, անգնահատելի դիրքում կհայտնվեն: Բացառապես AI ընկալվող նույնացուցիչների միջոցով իրենց սեփական առցանց ընդգրկումից օգտվելու հնարավորությունը հսկայական է և առաջարկում է անզուգական ներառում:

Ահա պատկերների ճանաչման որոշ սովորական գործեր.

Ի սկզբանե մենք պետք է որոշենք, թե արդյոք նկարի տեղեկատվությունը պարունակում է որոշակի հոդված, կարևորություն կամ շարժում: Այս առաջադրանքը, որպես կանոն, կարող է լուծվել սրտանց և առանց ջանքերի մարդու կողմից, սակայն այն դեռևս բավարար չափով չի լուծվել PC տեսլականում ընդհանուր գործի համար. ինքնահաստատող հոդվածներ հայեցողական հանգամանքներում: Այս խնդրի կառավարման ներկայիս տեխնիկան լավագույնս կարող է օգտագործվել միայն բացահայտ հոդվածների համար, օրինակ՝ հիմնական մաթեմատիկական տարրերը (օրինակ՝ բազմանիստ), մարդկային դեմքերը, տպագրված կամ արտագրված նիշերը կամ փոխադրամիջոցները, և բացահայտ հանգամանքներում, որոնք սովորաբար պատկերված են մինչև բոլորը։ տեսախցիկի հետ համեմատած առարկայի բնութագրվող պայծառությունը, հիմքը և կեցվածքը: Գրության մեջ ներկայացված են ճանաչման հարցի տարբեր տեսականիներ.

• Օբյեկտների ճանաչում

Մեկ կամ մի քանի նախապես որոշված ​​կամ սովորած հոդվածներ կամ առարկաների դասեր կարող են ընկալվել, սովորաբար նկարում դրանց 2D իրավիճակների կամ տեսարանի 3D դիրքերի հետ միասին:

• Նույնականացում

Ընկալվում է հոդվածի անհատական ​​դեպք։ Մոդելները որոշակի անձի դեմքի կամ եզակի նշանի կամ որոշակի մեքենայի ID-ի տարբերակիչ ապացույց են:

• Հայտնաբերում

Նկարի տեղեկատվությունը ուսումնասիրվում է որոշակի վիճակի համար: Մոդելները կլինիկական նկարներում պատկերավոր տարօրինակ բջիջների կամ հյուսվածքների հայտնաբերում են կամ տրանսպորտային միջոցի ճանաչում ծրագրավորված փողոցային ծախսերի շրջանակներում: Չափավոր պարզ և արագ հաշվարկներից կախված բացահայտումը այստեղ և այնտեղ օգտագործվում է հետաքրքիր պատկերների ավելի համեստ շրջաններ գտնելու համար, որոնք կարող են լրացուցիչ բաժանվել՝ ճիշտ թարգմանություն ստեղծելու համար ավելի շատ հաշվողական ռազմավարություններ պահանջելու միջոցով:

Կան մի քանի կոնկրետ ձեռնարկումներ, որոնք կախված են ճանաչումից, օրինակ.

• Բովանդակության վրա հիմնված նկարի վերականգնում

Այստեղ հայտնաբերվում են բոլոր նկարները նկարների ավելի մեծ դասավորությամբ, որոնք ունեն որոշակի նյութ: Նյութը կարող է որոշվել անսպասելի ձևով, օրինակ՝ օբյեկտիվ նկարի համեմատությամբ (տուր ինձ բոլոր նկարները, ինչպես X նկարը), կամ այնքանով, որքանով նշանակալի մակարդակի հետապնդման ստանդարտները, որոնք տրված են որպես տեքստի մուտքագրում (տուր ինձ բոլոր նկարները, որոնք պարունակում են բազմաթիվ նկարներ տներ, վերցված են ձմռանը և տրանսպորտային միջոցներ չկան):

• դիրքի գնահատում

մենք պետք է չափենք որոշակի հոդվածի դիրքը կամ ուղղությունը տեսախցիկի հետ համեմատած: Այս ռազմավարության մոդելային կիրառումը կօգնի ռոբոտին մեխանիկական արտադրության համակարգի պայմաններում տրանսպորտային գծից իրեր վերականգնելու համար:

• Նիշերի օպտիկական ճանաչում

OCR, որը տարբերակում է տպագիր կամ ձեռքով գրված բովանդակության նկարների նիշերը, հիմնականում նպատակ ունենալով ավելի շատ կոդավորել բովանդակությունը կազմակերպությունում և հնարավորություն տալ փոփոխելու կամ պատվիրելու Միչիգանի պետական ​​համալսարանի Համակարգչային գիտության և ճարտարագիտության բաժինը: Ռազմավարությունները ստեղծվում են օբյեկտները հայտնաբերելու, դրանց կարևորագույն կետերը գտնելու համար դրանք մյուսներից ճանաչելու և հաշվարկներ պլանավորելու համար, որոնք կարող են օգտագործվել մեքենայի կողմից բնութագրումը կատարելու համար: Նշանակալից հավելվածները ներառում են դեմքի ճանաչում, մատների տպավորության ճանաչելի ապացույց, ձայնագրման նկարի հետազոտություն, 3D հոդվածի մոդելի մշակում, ռոբոտի երթուղի և 3D ծավալային տեղեկատվության ներկայացում/հետազոտություն: Ebb-ի և հոսքի հետազոտության խնդիրները ներառում են կենսաչափական հաստատում, ծրագրավորված դիտարկում և հետևում, առանց ձեռքի HCI-ի, դեմքի ցուցադրում, համակարգչային ջրային նշագրում և առցանց արխիվների դիզայնի ուսումնասիրություն: Լաբորատորիայի ուշ շրջանավարտները զբաղվել են գրչության ճանաչմամբ, ստորագրության ստուգմամբ, տեսողական ուսուցմամբ և նկարների վերականգնման հարցերով»:

մոդել:

Մենք պետք է տեսնենք, որ նկարի թեման ճանաչելու հնարավորություն ունենալու համար պահանջվում են ցնցող մի քանի պիքսել տվյալներ, պարզել է MIT-ի մասնագետի կողմից քշված խումբը: Բացահայտումը կարող է արտասովոր առաջընթացներ առաջացնել առցանց նկարների մեքենայացված ճանաչելի ապացույցների մեջ և, ի վերջո, նախադրյալ տալ համակարգիչներին տեսնելու այնպես, ինչպես մարդիկ են անում: Հատկապես կարճ պատկերը ենթադրելը զգալի առաջընթաց կլինի՝ հետևաբար համացանցում միլիարդավոր նկարների գույքագրումը հնարավոր դարձնելու համար: Առայժմ նկարներ փնտրելու միայնակ մոտեցումները կախված են բովանդակային մակագրություններից, որոնք անհատները ձեռքով մուտքագրել են յուրաքանչյուր նկարի համար, և բազմաթիվ նկարներ նման տվյալների կարիք ունեն: Ծրագրավորված ID-ն նույնպես հնարավորություն է տալիս ֆայլերի նկարները ներբեռնելու համար, որոնք անհատները համակարգչային տեսախցիկներից ներբեռնում են իրենց ԱՀ՝ առանց յուրաքանչյուրը ձեռքով փորձելու և ենթագրերի: Նաև, ի վերջո, դա կարող է հուշել իրական մեքենայական տեսողությունը, որը կարող է երբեմն թույլ տալ ռոբոտներին տեսակավորել իրենց տեսախցիկներից ստացվող տեղեկատվությունը և դասավորել, թե որտեղ են գտնվում: այնպես որ, եթե երկու նկարները ունեն համեմատելի [թվերի] խմբավորում, դրանք ենթադրաբար համեմատական ​​են: կազմված ընդհանուր առմամբ նմանատիպ հոդվածից, ընդհանուր առմամբ նմանատիպ դասավորությամբ»: Եթե ​​մեկ նկարը կապված է մակագրության կամ վերնագրի հետ, ապա այդ պահին տարբեր նկարներ, որոնք համակարգում են դրա մաթեմատիկական կոդը, հավանաբար կցուցադրեն նմանատիպ տարր (օրինակ՝ մեքենա, ծառ կամ անհատ), ուստի մեկ նկարի հետ կապված անունը կարող է լինել։ տեղափոխվել է մյուսների մոտ: «Չափազանց շատ նկարների դեպքում, նույնիսկ ընդհանուր առմամբ պարզ հաշվարկները կարող են իսկապես լավ գործել» նկարներն այդպիսով ճանաչելիս:

⦁ Դեմքի ճանաչում

մենք գիտակցում ենք, որ դեմքի ճանաչման շրջանակները շարունակաբար հայտնի են դառնում որպես կենսաչափական տվյալների հեռացման մեթոդներ: Դեմքի ճանաչումը հիմնական մասն է կազմում կենսաչափական շրջանակների մեջ և գրավիչ է տարբեր ծրագրերի համար, ներառյալ տեսողական հետախուզությունը և անվտանգությունը: Տարբեր զեկույցներում դեմքի նկարների ընդհանուր բնակչության ճանաչման լույսի ներքո՝ դեմքի ճանաչումն անհավատալի ներուժ ունի՝ դառնալու որոշումների կայացման առաջնային կենսաչափական նորարարություն:

Նկարների ճանաչման համակարգեր

⦁ Շարժման քննություն

Մի քանի առաջադրանքներ նույնականացվում են շարժման գնահատման հետ, որտեղ նկարների հաջորդականությունը պատրաստվում է արագության չափիչ ստեղծելու համար կամ նկարի յուրաքանչյուր կիզակետում, կամ 3D տեսարանում, կամ նույնիսկ նկարները մատուցող տեսախցիկի վրա: Նման հանձնարարությունների օրինակներն են.

⦁ Էգոյի շարժում

Որոշել տեսախցիկի 3D անճկուն շարժումը (առանցքը և մեկնաբանությունը) տեսախցիկի կողմից ստեղծված նկարների հաջորդականությունից:

⦁ Հետևում

Հետևյալը կհետևի նկարների հաջորդականության մեջ հետաքրքրությունների կենտրոնների կամ բողոքների (օրինակ՝ մեքենաներ կամ մարդիկ) ավելի համեստ դասավորության զարգացումներին:

⦁ Օպտիկական հոսք

Սա պետք է որոշի նկարի յուրաքանչյուր կետի համար, թե ինչպես է այդ կետը շարժվում նկարի հարթության հետ համեմատած, այսինքն՝ նրա ակնհայտ շարժումը: Այս շարժումը արդյունք է և՛ այն բանի, թե ինչպես է համեմատվող 3D կետը շարժվում տեսարանում, և թե ինչպես է տեսախցիկը շարժվում տեսարանի համեմատությամբ:

⦁ Տեսարանի վերափոխում

Տեսարանի կամ տեսահոլովակի մեկ կամ (սովորաբար) ավելի շատ նկարների դեպքում տեսարանի վերարտադրումը նպատակաուղղված է գրանցելով տեսարանի 3D մոդելը: Ամենահեշտ դեպքում մոդելը կարող է լինել 3D ֆոկուսների մի փունջ: Ավելի կատարելագործված ռազմավարությունները ստեղծում են ընդհանուր 3D մակերեսի մոդել

⦁ Պատկերի վերակառուցում

Նկարի վերակառուցման կետը նկարներից իրարանցման (սենսորային աղմուկ, շարժումների անհասկանալիություն և այլն) տարհանումն է: Խառնաշփոթի հեռացման ամենաքիչ բարդ մեթոդաբանությունը տարբեր տեսակի ալիքներն են, օրինակ՝ ցածր անցումային կամ միջին ալիքները: Ավելի ժամանակակից ռազմավարություններն ակնկալում են մոդել, թե ինչպես են հարևանության պատկերների կառուցվածքները նմանվում, մոդել, որը ճանաչում է դրանք իրարանցումից: Սկզբում ուսումնասիրելով նկարի մասին տեղեկատվությունը մոտակա պատկերի կառուցվածքների, օրինակ՝ գծերի կամ եզրերի, և այնուհետև վերահսկելով տարանջատումը, որը կախված է քննության քայլից, իրարանցման տարհանման բարձր աստիճանը սովորաբար հակադրվում է ավելի քիչին: բարդ մեթոդաբանություններ. Այս ոլորտում մոդելը նրանց նկարչությունն է։ Մի քանի շրջանակներ անկախ հավելվածներ են, որոնք անդրադառնում են որոշակի գնահատման կամ ճանաչման խնդրին, մինչդեռ մյուսները ներառում են ավելի մեծ պլանի ենթահամակարգ, որը, օրինակ, պարունակում է ենթաշրջանակներ՝ մեխանիկական ակտուալների, դասավորության, տվյալների տեղեկատվական բազաների, մարդու մեքենայական ինտերֆեյսներ և այլն: Համակարգչի տեսլականի շրջանակի հատուկ կատարումը նույնպես կախված է նրանից, թե դրա օգտակարությունը նախապես որոշված ​​է, կամ եթե դրա որոշ մասը շատ լավ կարող է սովորել կամ ճշգրտվել գործունեության ընթացքում: Կան, ինչպես դա կարող է լինել, կանոնավոր հզորություններ, որոնք հայտնաբերված են բազմաթիվ PC տեսլականում