ရုပ်ပုံအသိအမှတ်ပြုခြင်း အဘယ်ကြောင့်အရေးကြီးသနည်း။

အင်တာနက်ပေါ်ရှိ အကြောင်းအရာ ၈၀ ရာခိုင်နှုန်းခန့်သည် အမြင်အာရုံဖြစ်သည်။ ရုပ်ပုံတဂ်လုပ်ခြင်းသည် အကြောင်းအရာဇယား၏ဘုရင်အဖြစ် အဘယ်ကြောင့် ရပ်တည်နိုင်သည်ကို သင်စတင်လေ့လာနိုင်ပါပြီ။ တစ်ဦးချင်းဖြစ်စေ၊ ကုမ္ပဏီဖြစ်စေ AI ရုပ်ပုံအသိအမှတ်ပြုမှုသည် အွန်လိုင်းတွင် ရုပ်ပုံများကို အနည်းအကျဉ်းမျှသာ ခွဲခြားသိရှိနိုင်စေခဲ့သည်။ နှစ်စဉ် ဒစ်ဂျစ်တယ်စနစ်ဖြင့် ဓာတ်ပုံပေါင်း ၆၅၇ ဘီလီယံခန့် လွှင့်တင်ခဲ့ပြီး အများစုမှာ ဆိုရှယ်မီဒီယာပေါ်တွင် ပေါ်နေပါသည်။ ဒီပုံတွေရဲ့ ကောင်းတဲ့အပိုင်းကတော့ ကုန်ပစ္စည်းတွေကို မရည်ရွယ်ဘဲ ကြော်ငြာနေတဲ့လူတွေပါ။ ၎င်း၏ အသန့်စင်ဆုံးပုံစံဖြင့် အသုံးပြုသူမှထုတ်ပေးသည့်အကြောင်းအရာ (UGC) သည် အကောင်းဆုံးပရိုမိုးရှင်းအမျိုးအစားကို ပံ့ပိုးပေးသောကြောင့် အမှတ်တံဆိပ်များအတွက် အကောင်းဆုံးလုပ်ဆောင်ပေးသူဖြစ်သည်။
ဆိုရှယ်မီဒီယာမှာ သုံးစွဲသူတွေ ဖော်ပြလာတဲ့အခါ ကုမ္ပဏီတွေကို သတိပေးဖို့ စျေးကွက်ရှာဖွေရေးကိရိယာတွေ ရှိတယ်၊ ဒါပေမယ့် ဘယ်သူကမှ သူတို့ရဲ့ နာမည်ကို လူမှုပို့စ်မှာ တဂ်မထည့်ဘဲ အမှတ်တံဆိပ်တွေ ပရိုမိုးရှင်းလုပ်တဲ့အခါကော။ ဤနေရာတွင် AI ရုပ်ပုံအသိအမှတ်ပြုမှုသည် ၎င်း၏တန်ဖိုးကို သက်သေထူသည်။ အကယ်၍ နည်းပညာသည် မှန်ကန်သောဒေတာအတွဲများကို ဖြည့်သွင်းပါက၊ AI သည် တိကျသော tag မဖော်ပြထားဘဲ ပုံတစ်ပုံကို ခွဲခြားသတ်မှတ်နိုင်သည်။ အမှတ်တံဆိပ်များသည် ၎င်းတို့၏လူမှုရေးဖော်ပြချက်များကို ခြေရာခံရန်နှင့် ခြေရာခံရန် ရလဒ်များသည် အဖိုးမဖြတ်နိုင်ပါ။

ရုပ်ပုံအသိအမှတ်ပြုခြင်း မည်သို့အလုပ်လုပ်သနည်း။

ကျွန်ုပ်တို့သိသည့်အတိုင်း AI သည် ဓာတ်ပုံများကို ရှာဖွေနေသည့် လူမှုမီဒီယာပလပ်ဖောင်းများကို ရှာဖွေနိုင်ပြီး ကျယ်ပြန့်သောဒေတာအစုံများနှင့် နှိုင်းယှဉ်နိုင်သည်။ ထို့နောက် ၎င်းသည် လူသားများ တတ်နိုင်သည်ထက် များစွာမြန်သည့်နှုန်းဖြင့် ကိုက်ညီသည့် သက်ဆိုင်ရာပုံများကို ဆုံးဖြတ်သည်။ ကုန်အမှတ်တံဆိပ်များသည် ဆိုရှယ်မီဒီယာတွင် ၎င်းတို့၏ကိုယ်ပိုင်အကြောင်းအရာနှင့် ဆင်တူသည့်အကြောင်းအရာများကို ရှာဖွေရန် ရုပ်ပုံအသိအမှတ်ပြုမှုကို အသုံးပြုသည်။ ဆိုလိုသည်မှာ အမှတ်တံဆိပ်တစ်ခု၏ လိုဂိုကို ခွဲခြားသတ်မှတ်ခြင်း သို့မဟုတ် လူမှုမီဒီယာအသုံးပြုသူများကြားတွင် အော်ဂဲနစ်ထည့်သွင်းထားသော ထုတ်ကုန်နေရာချထားမှုကို အသိအမှတ်ပြုခြင်းဟု ဆိုလိုသည်။ သတင်းအချက်အလက်များစွာဖြင့် လူသားများကို ကြမ်းတိုက်ခိုင်းခြင်းသည် ပင်ပန်းလွယ်သည်။ AI သည် လူသားအမှားအတွက် စိတ်မပူဘဲ ပြိုင်ဘက်ကင်းသော အဆင့်များတွင် တိကျသောရလဒ်များကို ပြန်ပေးသည်။ AI ရုပ်ပုံအသိအမှတ်ပြုမှုသည် စာသားမလိုအပ်ဘဲ ကုန်အမှတ်တံဆိပ်တစ်ခုအကြောင်း လူများပြောနေသည့်အရာကို စောင့်ကြည့်သည်။ သုံးစွဲသူများသည် ကုမ္ပဏီအမည်ကို ရိုက်ထည့်ရန် မလိုအပ်ဘဲ ၎င်းတို့၏ လူမှုဖော်ပြချက်များကို ခြေရာခံနိုင်သည့် အမှတ်တံဆိပ်များသည် အားသာချက်ရှိသည့် အနေအထားတွင် ရှိနေသည်။ AI အသိအမှတ်ပြု ခွဲခြားသတ်မှတ်မှုများမှတစ်ဆင့် ၎င်းတို့၏ကိုယ်ပိုင်အွန်လိုင်းလွှမ်းခြုံမှုသို့ ဝင်ရောက်ရန် အလားအလာသည် ကြီးမားပြီး နှိုင်းယှဉ်မထားသော လွှမ်းခြုံမှုကို ပေးဆောင်နိုင်မည်ဖြစ်သည်။

ဤသည်မှာ ရုပ်ပုံအသိအမှတ်ပြုခြင်း၏ ပုံမှန်အလုပ်အချို့ဖြစ်သည်-

ပထမဦးစွာ ကျွန်ုပ်တို့သည် ရုပ်ပုံဒေတာတွင် သီးခြားအရာဝတ္ထု၊ အင်္ဂါရပ် သို့မဟုတ် လုပ်ဆောင်ချက်အချို့ပါရှိ၊ မရှိ ဆုံးဖြတ်ရန် လိုအပ်သည်။ ဤတာဝန်ကို သာမန်အားဖြင့် လူသားတစ်ဦးမှ ပြင်းပြင်းထန်ထန် အားထုတ်စရာမလိုဘဲ ဖြေရှင်းနိုင်သော်လည်း ယေဘုယျကိစ္စအတွက် ကွန်ပျူတာအမြင်တွင် ကျေနပ်လောက်အောင် မဖြေရှင်းနိုင်သေးပါ- မတရားသော အခြေအနေများတွင် မတရားသော အရာဝတ္ထုများ။ ဤပြဿနာကို ကိုင်တွယ်ဖြေရှင်းရန် ရှိပြီးသားနည်းလမ်းများသည် ရိုးရှင်းသော ဂျီဩမေတြီအရာဝတ္ထုများ (ဥပမာ၊ polyhedra)၊ လူသားမျက်နှာများ၊ ပုံနှိပ်ထားသော သို့မဟုတ် လက်ဖြင့်ရေးထားသော အက္ခရာများ သို့မဟုတ် ယာဉ်များကဲ့သို့ တိကျသောအခြေအနေများတွင်သာ အကောင်းဆုံးဖြေရှင်းနိုင်သည် ကင်မရာနှင့် ဆက်စပ်နေသည့် အရာဝတ္ထု၏ အလင်းရောင်၊ နောက်ခံနှင့် ပုံသဏ္ဍာန်များ။ မတူကွဲပြားသော အသိအမှတ်ပြုမှုပြဿနာကို စာပေတွင် ဖော်ပြထားပါသည်။

• အရာဝတ္ထုကို အသိအမှတ်ပြုခြင်း။

ကြိုတင်သတ်မှတ်ထားသော သို့မဟုတ် သင်ယူထားသော အရာဝတ္ထု သို့မဟုတ် အရာဝတ္ထုအတန်းအစား တစ်ခု သို့မဟုတ် အများအပြားကို အသိအမှတ်ပြုနိုင်ပြီး၊ များသောအားဖြင့် ပုံရှိ ၎င်းတို့၏ 2D အနေအထားများ သို့မဟုတ် မြင်ကွင်းရှိ 3D poses များနှင့်အတူ အသိအမှတ်ပြုနိုင်သည်။

• သက်သေခံခြင်း။
အရာဝတ္ထုတစ်ခု၏ တစ်ဦးချင်းဥပမာတစ်ခုကို အသိအမှတ်ပြုသည်။ ဥပမာများသည် လူတစ်ဦး၏ မျက်နှာ သို့မဟုတ် လက်ဗွေကို ဖော်ထုတ်ခြင်း သို့မဟုတ် သီးခြားယာဉ်ကို ဖော်ထုတ်ခြင်း ဖြစ်သည်။

• ထောက်လှမ်းခြင်း။
ပုံဒေတာကို သီးခြားအခြေအနေတစ်ခုအတွက် စကင်န်ဖတ်သည်။ ဥပမာများသည် ဆေးဘက်ဆိုင်ရာပုံများတွင် ဖြစ်နိုင်ချေရှိသော ပုံမှန်မဟုတ်သော ဆဲလ်များ သို့မဟုတ် တစ်ရှူးများကို ရှာဖွေခြင်း သို့မဟုတ် အလိုအလျောက် လမ်းဖြတ်ခပေးသည့်စနစ်တွင် ယာဉ်တစ်စီးကို ရှာဖွေခြင်း ဖြစ်သည်။ ရိုးရှင်းပြီး မြန်ဆန်သော တွက်ချက်မှုများအပေါ် အခြေခံ၍ ထောက်လှမ်းခြင်းကို တစ်ခါတစ်ရံတွင် မှန်ကန်သော အဓိပ္ပာယ်ဖွင့်ဆိုချက်ရရှိရန် တွက်ချက်မှုလိုအပ်သော နည်းပညာများဖြင့် နောက်ထပ်ခွဲခြမ်းစိတ်ဖြာနိုင်သည့် စိတ်ဝင်စားဖွယ်ကောင်းသော ပုံဒေတာ၏ သေးငယ်သော ဒေသများကို ရှာဖွေရန်အတွက် တစ်ခါတစ်ရံတွင် အသုံးပြုပါသည်။

အသိအမှတ်ပြုမှုအပေါ်အခြေခံ၍ အထူးပြုလုပ်ဆောင်စရာများစွာ ရှိပါသည်၊ ဥပမာ-

• အကြောင်းအရာအခြေခံပုံ ထုတ်ယူခြင်း။
ဤနေရာတွင် သီးခြားအကြောင်းအရာတစ်ခုပါရှိသော ပိုကြီးသောပုံများအစုအဝေးတွင် ပုံအားလုံးကို ရှာဖွေခြင်း။ အကြောင်းအရာကို ပုံစံအမျိုးမျိုးဖြင့် သတ်မှတ်နိုင်သည်၊ ဥပမာ တူညီမှုသတ်မှတ်ချက်များတွင် ပစ်မှတ်ပုံတစ်ပုံ (ပုံ X နှင့်ဆင်တူသော ပုံအားလုံးကို ကျွန်ုပ်အား ပေးပါ) သို့မဟုတ် စာသားထည့်သွင်းမှုအဖြစ် ပေးထားသော အဆင့်မြင့်ရှာဖွေမှုစံနှုန်းသတ်မှတ်ချက်များတွင် (ပါရှိသော ပုံအားလုံးကို ကျွန်ုပ်အား ပေးပါ။ အိမ်တော်တော်များများက ဆောင်းရာသီမှာ သိမ်းခံရပြီး သူတို့မှာ ကားမရှိဘူး)။

• Pose ခန့်မှန်းချက်
ကင်မရာနှင့် ဆက်စပ်နေသော အရာဝတ္ထုတစ်ခု၏ တည်နေရာ သို့မဟုတ် တိမ်းညွှတ်မှုကို ခန့်မှန်းရန် လိုအပ်သည်။ ဤနည်းပညာအတွက် နမူနာအပလီကေးရှင်းတစ်ခုသည် စည်းဝေးပွဲလိုင်းအခြေအနေတစ်ခုတွင် စက်ရုပ်တစ်ရုပ်မှ အရာဝတ္ထုများကို သယ်ယူပေးသည့် ခါးပတ်မှ ထုတ်ယူရာတွင် ကူညီပေးမည်ဖြစ်သည်။

• Optical character အသိအမှတ်ပြုမှု
OCR ပုံနှိပ်ခြင်း သို့မဟုတ် လက်ဖြင့်ရေးထားသော စာသားများ၏ ရုပ်ပုံများတွင် စာလုံးများကို ခွဲခြားသတ်မှတ်ခြင်းဖြစ်ပြီး များသောအားဖြင့် စာသားကို ဖော်မတ်ကုဒ်ပြောင်းရန်နှင့် ကွန်ပျူတာသိပ္ပံနှင့် အင်ဂျင်နီယာဌာန၊ မစ်ရှီဂန်ပြည်နယ် တက္ကသိုလ်၊ တည်းဖြတ်ခြင်း သို့မဟုတ် အညွှန်းကိန်းပြုလုပ်ခြင်းတို့ကို လုပ်ဆောင်နိုင်သည်။ “Pattern Recognition and Image Processing (PRIP) Lab မှ ဆရာများနှင့် ကျောင်းသားများသည် ပုံစံများ သို့မဟုတ် အရာဝတ္တုများကို မှတ်မိရန် စက်များအသုံးပြုမှုကို စုံစမ်းစစ်ဆေးသည်။ အရာဝတ္တုများကို အာရုံခံစားနိုင်ရန်၊ ၎င်းတို့၏ အင်္ဂါရပ်များကို အခြားသူများနှင့် ခွဲခြားသိရှိရန်၊ အမျိုးအစားခွဲခြားမှုပြုလုပ်ရန် စက်တစ်ခုမှ အသုံးပြုနိုင်သည့် အယ်လဂိုရီသမ်များကို ဒီဇိုင်းထုတ်ရန် နည်းလမ်းများကို တီထွင်ထားသည်။ အရေးပါသော အပလီကေးရှင်းများတွင် မျက်နှာအသိအမှတ်ပြုခြင်း၊ လက်ဗွေဖော်ထုတ်ခြင်း၊ စာရွက်စာတမ်းပုံသဏ္ဍာန်ခွဲခြမ်းစိတ်ဖြာခြင်း၊ 3D အရာဝတ္ထုပုံစံတည်ဆောက်ခြင်း၊ စက်ရုပ်လမ်းညွှန်ခြင်းနှင့် 3D ထုထည်ဒေတာကို ပုံဖော်ခြင်း/ရှာဖွေရေးတို့ ပါဝင်သည်။ လက်ရှိသုတေသနပြဿနာများတွင် biometric စစ်မှန်ကြောင်းအထောက်အထားပြခြင်း၊ အလိုအလျောက်စောင့်ကြည့်ခြင်းနှင့်ခြေရာခံခြင်း၊ လက်မဲ့ HCI၊ မျက်နှာပုံစံပြခြင်း၊ ဒစ်ဂျစ်တယ်ရေစာအမှတ်အသားပြုလုပ်ခြင်းနှင့် အွန်လိုင်းစာရွက်စာတမ်းများ၏ဖွဲ့စည်းပုံကိုခွဲခြမ်းစိတ်ဖြာခြင်းတို့ပါဝင်သည်။ မကြာသေးမီက ဓာတ်ခွဲခန်းမှ ဘွဲ့ရသူများသည် လက်ရေးမှတ်ခြင်း၊ လက်မှတ်အတည်ပြုခြင်း၊ အမြင်အာရုံသင်ယူခြင်းနှင့် ရုပ်ပုံပြန်လည်ရယူခြင်းတို့ကို လုပ်ဆောင်ခဲ့ကြသည်။”

⦁ မျက်နှာအသိအမှတ်ပြုမှု
မျက်နှာမှတ်သားမှုစနစ်များသည် ဇီဝဗေဒဆိုင်ရာ အချက်အလက်များကို ထုတ်ယူသည့်နည်းလမ်းအဖြစ် တဖြည်းဖြည်း လူကြိုက်များလာကြောင်း ကျွန်ုပ်တို့သိပါသည်။ မျက်နှာမှတ်မိခြင်းသည် biometric စနစ်များတွင် အရေးပါသောအခန်းကဏ္ဍမှပါဝင်ပြီး အမြင်အာရုံထောက်လှမ်းခြင်းနှင့် လုံခြုံရေးအပါအဝင် အပလီကေးရှင်းများစွာအတွက် ဆွဲဆောင်မှုတစ်ခုဖြစ်သည်။ စာရွက်စာတမ်းအမျိုးမျိုးရှိ မျက်နှာပုံများကို ယေဘူယျအများပြည်သူတို့က လက်ခံခြင်းကြောင့် မျက်နှာမှတ်မိခြင်းမှာ ရွေးချယ်စရာ မျိုးဆက်သစ် biometric နည်းပညာဖြစ်လာရန် အလားအလာကောင်းများရှိပါသည်။

ရုပ်ပုံအသိအမှတ်ပြုစနစ်များ

⦁ လှုပ်ရှားမှု ခွဲခြမ်းစိတ်ဖြာခြင်း။
ပုံတစ်ပုံချင်းစီတွင်ဖြစ်စေ 3D အခင်းအကျင်းတွင်ဖြစ်စေ သို့မဟုတ် ပုံများကိုထုတ်ပေးသည့်ကင်မရာ၏အလျင်ကို ခန့်မှန်းတွက်ချက်ရန်အတွက် ရွေ့လျားမှုခန့်မှန်းခြင်းနှင့် သက်ဆိုင်သည့်အလုပ်များစွာရှိသည်။ ထိုကဲ့သို့သော လုပ်ငန်းဆောင်တာများ၏ ဥပမာများမှာ-

⦁  အတ္တရွေ့လျားမှု
ကင်မရာ၏ 3D တင်းကျပ်သော ရွေ့လျားမှု (လည်ပတ်ခြင်းနှင့် ဘာသာပြန်ခြင်း) ကို ကင်မရာမှ ထုတ်လုပ်သော ပုံအစီအစဥ်မှ ဆုံးဖြတ်ခြင်း။

⦁ ခြေရာခံခြင်း။
ခြေရာခံခြင်းသည် ရုပ်ပုံအစီအစဥ်ရှိ စိတ်ဝင်စားဖွယ်အချက်များ သို့မဟုတ် အရာဝတ္ထုအသေးစား (ဥပမာ၊ ယာဉ်များ သို့မဟုတ် လူသားများ) ၏ လှုပ်ရှားမှုများကို လိုက်နာခြင်းဖြစ်သည်။

⦁ Optical flow
ဤသည်မှာ ပုံရှိ အမှတ်တစ်ခုစီအတွက်၊ ထိုအမှတ်သည် ပုံသဏ္ဍာန်နှင့် ဆက်စပ်နေသည်၊ ဆိုလိုသည်မှာ ၎င်း၏ထင်ရှားသောရွေ့လျားမှုကို ဆုံးဖြတ်ရန်ဖြစ်သည်။ ဤရွေ့လျားမှုသည် အခင်းဖြစ်ပွားရာနေရာနှင့် ဆက်စပ်နေသော 3D အမှတ် ရွေ့လျားပုံနှင့် ကင်မရာသည် မြင်ကွင်းနှင့် ဆက်စပ်နေပုံ နှစ်ခုစလုံး၏ ရလဒ်ဖြစ်သည်။

⦁ မြင်ကွင်းပြန်လည်တည်ဆောက်ခြင်း။
မြင်ကွင်းတစ်ခု သို့မဟုတ် ဗီဒီယိုတစ်ခု၏ နောက်ထပ်ပုံတစ်ပုံ သို့မဟုတ် (ပုံမှန်အားဖြင့်) ပေးထားသော မြင်ကွင်းပြန်လည်တည်ဆောက်မှုသည် မြင်ကွင်း၏ 3D မော်ဒယ်ကို တွက်ချက်ရန် ရည်ရွယ်သည်။ အရိုးရှင်းဆုံးအခြေအနေတွင် မော်ဒယ်သည် 3D အမှတ်များ အစုတစ်ခု ဖြစ်နိုင်သည်။ ပိုမိုဆန်းပြားသောနည်းလမ်းများသည် ပြီးပြည့်စုံသော 3D မျက်နှာပြင်ပုံစံကို ထုတ်လုပ်သည်။

⦁ ရုပ်ပုံပြန်လည်ထူထောင်ခြင်း။
ရုပ်ပုံပြန်လည်ပြုပြင်ခြင်း၏ ရည်ရွယ်ချက်မှာ ရုပ်ပုံများမှ ဆူညံသံ (အာရုံခံ ဆူညံသံ၊ လှုပ်ရှားမှု မှုန်ဝါးခြင်း စသည်) ကို ဖယ်ရှားရန်ဖြစ်သည်။ ဆူညံသံများကို ဖယ်ရှားရန်အတွက် အရိုးရှင်းဆုံး ဖြစ်နိုင်ချေနည်းလမ်းမှာ low-pass filter သို့မဟုတ် median filter များကဲ့သို့သော filter အမျိုးအစားများဖြစ်သည်။ ပိုမိုခေတ်မီသောနည်းလမ်းများသည် ဒေသဆိုင်ရာပုံသဏ္ဍာန်ပုံသဏ္ဍာန်ပုံသဏ္ဌာန်ကို ဆူညံသံနှင့် ကွဲပြားစေသည့် မော်ဒယ်အဖြစ် ယူဆသည်။ မျဉ်းများ သို့မဟုတ် အစွန်းများကဲ့သို့သော ဒေသဆိုင်ရာ ရုပ်ပုံတည်ဆောက်ပုံများ၏ စည်းကမ်းချက်များအရ ရုပ်ပုံဒေတာကို ဦးစွာ ပိုင်းခြားစိတ်ဖြာပြီး ခွဲခြမ်းစိတ်ဖြာမှုအဆင့်မှ ဒေသဆိုင်ရာ အချက်အလက်များအပေါ် အခြေခံ၍ စစ်ထုတ်ခြင်းကို ထိန်းချုပ်ခြင်းဖြင့်၊ ရိုးရှင်းသောနည်းလမ်းများနှင့် နှိုင်းယှဉ်ပါက ပိုမိုကောင်းမွန်သော ဆူညံသံဖယ်ရှားမှုအဆင့်ကို ရရှိတတ်သည်။ ဒီနယ်ပယ်မှာ ဥပမာတစ်ခုက သူတို့ရဲ့ ပန်းချီကားပါ။ အချို့သောစနစ်များသည် သီးခြားတိုင်းတာခြင်း သို့မဟုတ် ထောက်လှမ်းခြင်းပြဿနာကို ဖြေရှင်းပေးသည့် သီးခြားအပလီကေးရှင်းများဖြစ်ပြီး၊ အချို့သောစနစ်များသည် ပိုမိုကြီးမားသောဒီဇိုင်း၏ခွဲတမ်းစနစ်တစ်ခုဖြစ်ပြီး၊ ဥပမာအားဖြင့် စက်ပိုင်းဆိုင်ရာလှုံ့ဆော်ပေးသူများထိန်းချုပ်ရန် စနစ်ခွဲများ၊ အစီအစဉ်ဆွဲခြင်း၊ အချက်အလက်ဒေတာဘေ့စ်များ၊ လူသားများပါ၀င်သည်။ machine interfaces စသည်တို့။ ကွန်ပြူတာအမြင်စနစ်၏ တိကျသောအကောင်အထည်ဖော်မှုသည် ၎င်း၏လုပ်ဆောင်နိုင်စွမ်းကို ကြိုတင်သတ်မှတ်ထားခြင်းရှိမရှိ သို့မဟုတ် လုပ်ဆောင်ချက်အတွင်း အချို့သောအစိတ်အပိုင်းများကို လေ့လာနိုင် သို့မဟုတ် ပြုပြင်မွမ်းမံခြင်းအပေါ်လည်း မူတည်ပါသည်။ သို့သော် ကွန်ပျူတာအမြင်စနစ်များစွာတွင် တွေ့ရလေ့ရှိသော ပုံမှန်လုပ်ဆောင်ချက်များရှိပါသည်။

 

ရုပ်ပုံအသိအမှတ်ပြုမှုဖြင့် ပိုမိုနက်ရှိုင်းစွာ သင်ယူခြင်း။

AI မတိုင်မီက ရုပ်ပုံအသိအမှတ်ပြုခြင်းမှာ ရှိခဲ့သည်။ သို့သော် စက်သင်ယူမှုအချက်သည် အရာဝတ္ထု သို့မဟုတ် လူတစ်ဦး၏မျက်နှာကို ဖော်ထုတ်ရန်အတွက် တော်လှန်ရေးနည်းလမ်းများဖြစ်သည်။ သို့သော် ၎င်းကို ကျွေးမွေးရန် ဒေတာရှိမှသာ စက်သင်ယူခြင်းသည် ထိရောက်သည်။ AI ၏ အလိုအလျောက်စနစ်အားလုံးအတွက်၊ ပုံများကိုခွဲခြားသတ်မှတ်ရန် ၎င်းကိုတာဝန်ပေးခြင်းသည် ရိုးရှင်းသောတောင်းဆိုမှုမဟုတ်ပါ။ ကျွန်ုပ်တို့၏ ရုပ်ပုံများကို နားလည်ခြင်းသည် ဒုတိယသဘာဝဖြစ်သည်။ ငယ်ငယ်ကတည်းက လုပ်ဖို့ အစီအစဉ်ရှိတယ်။ စက်တစ်လုံးကို အတူတူမေးခြင်းသည် ရိုးရှင်းသော လုပ်ငန်းစဉ်တစ်ခုမဟုတ်ပါ။ ထို့အတွက်ကြောင့် AI အသိအမှတ်ပြုမှု၏ နောက်ထပ်ရေပန်းစားသောပုံစံများထဲမှ တစ်ခုမှာ convolutional neural networks (CNN) ဖြစ်သည်။ CNN သည် တစ်ခုနှင့်တစ်ခု ဘေးတွင်ရှိသော pixels များကို အာရုံစိုက်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ အနီးကပ်တည်နေရာပြထားသောပုံများသည် ဆက်စပ်မှုရှိနိုင်ချေပိုများသည်၊ ဆိုလိုသည်မှာ အရာဝတ္ထုတစ်ခု သို့မဟုတ် မျက်နှာတစ်ခုသည် ပိုမိုပွင့်လင်းမြင်သာသောရုပ်ပုံတစ်ပုံနှင့် တိုက်ဆိုင်နေသည်။
ဆိုရှယ်မီဒီယာတွင် ငွေရှာလိုသော ကုန်အမှတ်တံဆိပ်များသည် AI ရုပ်ပုံအသိအမှတ်ပြုမှုတွင် ရှင်းရှင်းလင်းလင်း အကျိုးကျေးဇူးများရရှိသော်လည်း ၎င်း၏အသုံးပြုမှုကိစ္စများသည် ပိုမိုနက်ရှိုင်းသည်။ မောင်းသူမဲ့ကားများသည် မော်တော်ယာဥ်လောကတွင် နောက်ထပ်အကြီးစားအရာတစ်ခုဖြစ်လာတော့မည်ဖြစ်ပြီး AI ရုပ်ပုံမှတ်သားခြင်းနည်းပညာသည် ၎င်းတို့အား စွမ်းအားမြှင့်ရန် ကူညီပေးနေသည်။ အလိုအလျောက်မတိုက်မိစေဘဲ လမ်းပေါ်ရှိ အရာဝတ္တုများနှင့် လူများကို ထောက်လှမ်းနိုင်သော အလိုအလျောက်မောင်းနှင်သည့်ကားတစ်စီး။ အသိဥာဏ်ရှိသော ဆုံးဖြတ်ချက်များချရန် ရုပ်ပုံများကို အသိအမှတ်ပြုရန် လိုအပ်သည်။ မောင်းသူမဲ့ကားတိုင်းတွင် အခြားရွေ့လျားနေသောယာဉ်များ၊ စက်ဘီးစီးသူများ၊ လူများကို ခွဲခြားသိမြင်နိုင်စေရန်အတွက် အာရုံခံကိရိယာများစွာကို တပ်ဆင်ထားပါသည်။ အခြေခံအားဖြင့် အန္တရာယ်ဖြစ်စေနိုင်သော မည်သည့်အရာကိုမဆို ပြုလုပ်နိုင်သည်။ အော်တိုမက်တစ်ကားတစ်စီးသည် သက်တမ်းရင့်ယာဉ်မောင်းတစ်ဦးကဲ့သို့ လမ်းအန္တရာယ်များကို စီမံဆောင်ရွက်ရန် လိုအပ်သည်။ 2020 ခုနှစ်တွင် မောင်းသူမဲ့ကားများ လမ်းပေါ်မဝင်မီ တွန်းလှန်ရမည့် ကဏ္ဍအချို့ ရှိပါသေးသည်။ သို့သော် မော်တော်ကား အလိုအလျောက်စနစ် စတင်သောအခါတွင် AI ရုပ်ပုံအသိအမှတ်ပြုမှုသည် ၎င်းတို့နောက်ကွယ်တွင် လုံခြုံစွာ အလုပ်လုပ်နိုင်သော အဓိက ယာဉ်မောင်းများထဲမှ တစ်ခု ဖြစ်လာမည်ဖြစ်သည်။
⦁ ရုပ်ပုံရယူခြင်း။
ဒစ်ဂျစ်တယ်ရုပ်ပုံတစ်ပုံကို ရုပ်ပုံအာရုံခံကိရိယာတစ်ခု သို့မဟုတ် အများအပြားက ထုတ်လုပ်ထားပြီး၊ အလင်း-အာရုံခံကင်မရာအမျိုးအစားများအပြင် အကွာအဝေးအာရုံခံကိရိယာများ၊ ဓာတ်မှန်ရိုက်ကိရိယာများ၊ ရေဒါများ၊ အလွန်ဆိုရိုးစွန်းကင်မရာများ စသည်တို့ပါဝင်သည့် အာရုံခံကိရိယာအမျိုးအစားပေါ် မူတည်၍ ထွက်ပေါ်လာသော ဓာတ်ပုံဒေတာ၊ သာမန် 2D ရုပ်ပုံ၊ 3D ထုထည် သို့မဟုတ် ရုပ်ပုံအစီအစဥ်တစ်ခုဖြစ်သည်။ ပစ်ဇယ်တန်ဖိုးများသည် ပုံမှန်အားဖြင့် ရောင်စဉ်တန်းတစ်ခု သို့မဟုတ် အများအပြားရှိ အလင်းပြင်းအားနှင့် သက်ဆိုင်သည် (မီးခိုးရောင်ပုံများ သို့မဟုတ် အရောင်အသွေးပုံများ)၊ သို့သော် အနက်၊ စုပ်ယူမှု သို့မဟုတ် အသံ သို့မဟုတ် လျှပ်စစ်သံလိုက်လှိုင်းများ၏ ရောင်ပြန်ဟပ်မှု သို့မဟုတ် နျူကလီးယားသံလိုက်ပဲ့တင်ရိုက်ခတ်မှုကဲ့သို့သော ရုပ်ပိုင်းဆိုင်ရာတိုင်းတာမှုများနှင့်လည်း ဆက်စပ်နိုင်သည်။
⦁ ကြိုတင်လုပ်ဆောင်ခြင်း-
အချက်အလက်အချို့ကို ထုတ်ယူရန်အတွက် ကွန်ပျူတာအမြင်နည်းလမ်းကို ရုပ်ပုံဒေတာတွင် အသုံးမပြုမီ၊ ၎င်းသည် နည်းလမ်းအားဖြင့် ယူဆချက်အချို့ကို ကျေနပ်ကြောင်း သေချာစေရန်အတွက် ဒေတာကို ပုံမှန်အားဖြင့် လုပ်ဆောင်ရန် လိုအပ်ပါသည်။ ဥပမာများ
1. ပုံသြဒိနိတ်စနစ်မှန်ကန်ကြောင်း သေချာစေရန်အတွက် ပြန်လည်နမူနာယူပါ။
2. အာရုံခံဆူညံသံသည် မှားယွင်းသောအချက်အလက်များကို မဖော်ပြကြောင်း သေချာစေရန်အတွက် ဆူညံမှုလျှော့ချခြင်း။
3. သက်ဆိုင်ရာအချက်အလက်များကို ရှာဖွေတွေ့ရှိကြောင်း သေချာစေရန် အလင်းအမှောင်ကို မြှင့်တင်ပေးခြင်း။
4. ဒေသအလိုက် သင့်လျော်သော စကေးများဖြင့် ရုပ်ပုံတည်ဆောက်ပုံများကို မြှင့်တင်ရန် စကေး-အာကာသ ကိုယ်စားပြုမှု။
⦁ လုပ်ဆောင်ချက် ထုတ်ယူခြင်း-
ရှုပ်ထွေးမှုအဆင့်အမျိုးမျိုးရှိ ရုပ်ပုံအင်္ဂါရပ်များကို ရုပ်ပုံဒေတာမှ ထုတ်ယူသည်။ ထိုသို့သောအင်္ဂါရပ်များ၏ သာမာန်ဥပမာများမှာ မျဉ်းများ၊ အစွန်းများနှင့် အခေါင်များဖြစ်သည်။
ထောင့်များ၊ blobs သို့မဟုတ် အမှတ်များကဲ့သို့သော စိတ်ဝင်စားဖွယ်ရာအချက်များ ပိုမိုရှုပ်ထွေးသောအင်္ဂါရပ်များသည် အသွင်အပြင်၊ ပုံသဏ္ဍာန် သို့မဟုတ် ရွေ့လျားမှုနှင့် ဆက်စပ်နေနိုင်သည်။
⦁ ရှာဖွေတွေ့ရှိခြင်း/အပိုင်းခွဲခြင်း-
စီမံဆောင်ရွက်ရာတွင် တစ်ချိန်ချိန်၌ ရုပ်ပုံ၏အမှတ်များ သို့မဟုတ် ပုံ၏ဒေသများသည် နောက်ထပ်လုပ်ဆောင်ခြင်းအတွက် သက်ဆိုင်ရာ ဆုံးဖြတ်ချက်တစ်ခုကို ချမှတ်သည်။ ဥပမာများ
1. တိကျသော စိတ်ဝင်စားဖွယ်အချက်များ ရွေးချယ်ခြင်း။
2. စိတ်ပါဝင်စားသည့်အရာဝတ္ထုတစ်ခုပါဝင်သည့် တစ်ခု သို့မဟုတ် အများအပြားကို အပိုင်းခွဲခြင်း။
⦁ အဆင့်မြင့်လုပ်ဆောင်ခြင်း-
ဤအဆင့်တွင် ထည့်သွင်းမှုသည် ယေဘုယျအားဖြင့် သေးငယ်သောဒေတာအစုတစ်ခုဖြစ်ပြီး ဥပမာအားဖြင့် သီးခြားအရာဝတ္ထုတစ်ခုပါ၀င်သည်ဟု ယူဆရသော အမှတ်များ သို့မဟုတ် လှုပ်ရှားပုံရိပ်ဒေသတစ်ခုဖြစ်သည်။ ကျန်ရှိသော စီမံဆောင်ရွက်မှုများသည် ဥပမာအားဖြင့်-
1. ဒေတာသည် မော်ဒယ်အခြေခံနှင့် အပလီကေးရှင်းဆိုင်ရာ ယူဆချက်များကို ကျေနပ်စေကြောင်း အတည်ပြုခြင်း။
2. အရာဝတ္ထုပုံသဏ္ဍာန် သို့မဟုတ် အရာဝတ္ထုအရွယ်အစားကဲ့သို့ အပလီကေးရှင်းဆိုင်ရာ ကန့်သတ်ဘောင်များကို ခန့်မှန်းခြင်း။
3. ရှာဖွေတွေ့ရှိထားသော အရာဝတ္တုကို အမျိုးအစားများ ကွဲပြားစွာ ခွဲခြားသတ်မှတ်ခြင်း။ ထို့ကြောင့်၊ ရုပ်ပုံလုပ်ဆောင်ခြင်းသည် AI သည် ရုပ်ပုံအား ခွဲခြားသိမြင်နိုင်ပြီး ရုပ်ပုံခွဲခြားသတ်မှတ်မှုနှင့်အညီ တုံ့ပြန်ရန် ကူညီပေးပါသည်။

ပုံသဏ္ဍာန်၏ ချောမွေ့သော အနာဂတ်

နည်းပညာ တိုးတက်လာသည်နှင့်အမျှ ရုပ်ပုံအသိအမှတ်ပြုမှုသည် ပိုမိုကြီးမားသော ရလဒ်များ ထွက်ပေါ်လာမည်ဖြစ်သည်။ Lobster ရှိ Machine Learning ၏ အကြီးအကဲ Vladimir Pavlov က “အရာဝတ္တုများကို အသိအမှတ်ပြုခြင်းအတွက် သင်္ချာအခြေခံသည် အချိန်ကြာမြင့်စွာ တည်ရှိနေသော်လည်း ကွန်ပျူတာအမြင်ဆိုင်ရာ အယ်လဂိုရီသမ်များကို အသုံးပြု၍ နည်းပညာဆိုင်ရာ အလားအလာများ မကြာသေးမီက ထွက်ပေါ်လာခဲ့သည်။ ယခုအခါတွင်၊ အာရုံကြောကွန်ရက်များသည် လူသားများထက် ပိုမိုကောင်းမွန်စွာ လုပ်ဆောင်နိုင်သော ပြီးပြည့်စုံသော detectors များကို ဖန်တီးနိုင်စေပါသည်။ အမိုက်စားကြီးသည် လေ့ကျင့်မှုအတွက် အမှတ်အသားပြုထားသော ပုံဒေတာအတွဲများ ရှိနေခြင်းကို ထိန်းထားနိုင်သော်လည်း မကြာမီကာလအတွင်းတွင် ၎င်းသည် ပြဿနာရှိမည်မဟုတ်ပါ။ ကွန်ပြူတာအမြင်ဆိုင်ရာ အင်ဂျင်နီယာများသည် ကိုယ်တိုင်သင်ယူခြင်းဆိုင်ရာ အယ်လဂိုရီသမ်များကို တက်ကြွစွာ လုပ်ဆောင်နေကြပါသည်။”။ အနာဂတ်တွင် အမြင်ဆိုင်ရာ ဆက်သွယ်မှုများ၏ လွှမ်းမိုးမှုနှင့်အတူ၊ ရုပ်ပုံအသိအမှတ်ပြုမှုသည် ကျွန်ုပ်တို့မြင်ရသည့် ပုံများစွာ၏နောက်ကွယ်တွင် အဓိကကျသောအချက်ဖြစ်လာမည်ဖြစ်သည်။ လက်တွေ့ဘဝမှာရော အွန်လိုင်းမှာရော။