AI பட அங்கீகாரத்திற்கான வழிகாட்டி

படத்தை அடையாளம் காண்பது ஏன் முக்கியம்?

இணையத்தில் உள்ள உள்ளடக்கத்தில் 80 சதவீதம் காட்சிப் பொருளாகவே உள்ளது. படக் குறியிடல் ஏன் உள்ளடக்க அட்டவணையின் ராஜாவாக அதன் இடத்தைப் பிடிக்கலாம் என்பதை நீங்கள் ஏற்கனவே தொடங்கலாம். தனிநபர்களாக இருந்தாலும் சரி நிறுவனங்களாக இருந்தாலும் சரி, AI பட அங்கீகாரம் குறைந்த பட்ச வம்புகளுடன் ஆன்லைனில் காட்சிகளை அடையாளம் காண்பதை சாத்தியமாக்கியுள்ளது. ஒவ்வொரு ஆண்டும் டிஜிட்டல் முறையில் 657 பில்லியன் புகைப்படங்கள் வெளியிடப்படுகின்றன, பெரும்பாலானவை சமூக ஊடகங்களில் தோன்றும். அந்த படங்களில் ஒரு நல்ல பகுதி மக்கள் தயாரிப்புகளை விளம்பரப்படுத்துகிறார்கள், அவர்கள் அறியாமல் அவ்வாறு செய்தாலும் கூட. பயனரால் உருவாக்கப்பட்ட உள்ளடக்கம் (UGC) அதன் தூய்மையான வடிவில் பிராண்டுகளுக்கு சிறந்த ஊக்குவிப்பாகும், ஏனெனில் இது சிறந்த விளம்பரத்தை வழங்குகிறது.
சமூக ஊடகங்களில் நுகர்வோர் குறிப்பிடப்படும்போது நிறுவனங்களை எச்சரிக்க மார்க்கெட்டிங் கருவிகள் உள்ளன, ஆனால் சமூக இடுகையில் யாரும் தங்கள் பெயரைக் குறிக்காமல் பிராண்டுகளின் விளம்பரம் நடைபெறும்போது என்ன செய்வது? இங்குதான் AI பட அங்கீகாரம் அதன் மதிப்பை நிரூபிக்கிறது. தொழில்நுட்பம் சரியான தரவுத்தொகுப்புகளை வழங்கினால், குறிப்பிட்ட குறிச்சொல் குறிப்புகள் இல்லாமல் AI ஒரு படத்தை அடையாளம் காண முடியும். பிராண்டுகள் தங்கள் சமூகக் குறிப்புகளைக் கண்காணிக்கவும் கண்டறியவும் முடிவுகள் விலைமதிப்பற்றவை.

படத்தை அறிதல் எப்படி வேலை செய்கிறது?

AI ஆனது புகைப்படங்களைத் தேடும் சமூக ஊடக தளங்களைத் தேடலாம் மற்றும் அவற்றை விரிவான தரவுத் தொகுப்புகளுடன் ஒப்பிடலாம். மனிதர்களின் திறனைக் காட்டிலும் மிக வேகமாக பொருந்தக்கூடிய பொருத்தமான படத்தை அது தீர்மானிக்கிறது. பிராண்டுகள் சமூக ஊடகங்களில் தங்களுடைய சொந்த உள்ளடக்கத்தைக் கண்டறிய பட அங்கீகாரத்தைப் பயன்படுத்துகின்றன. அதாவது ஒரு பிராண்டின் லோகோவை அடையாளம் காண்பது அல்லது சமூக ஊடக பயனர்களிடையே இயற்கையாக வைக்கப்பட்டுள்ள தயாரிப்பு இடத்தை அங்கீகரிப்பது. இவ்வளவு தகவல்களை மனிதர்களை இழுத்துச் செல்லச் சொல்வது எளிதில் சோர்வாகிவிடும். மனிதப் பிழையைப் பற்றி AI கவலைப்படுவதில்லை, மேலும் இணையற்ற அளவில் துல்லியமான முடிவுகளைத் தருகிறது. AI பட அங்கீகாரம் உரையின் தேவை இல்லாமல் ஒரு பிராண்டைப் பற்றி மக்கள் என்ன சொல்கிறார்கள் என்பதைக் கண்காணிக்கும். பயனர்கள் நிறுவனத்தின் பெயரைத் தட்டச்சு செய்யத் தேவையில்லாமல் தங்கள் சமூகக் குறிப்புகளைக் கண்காணிக்கக்கூடிய பிராண்டுகள் தங்களை ஒரு சாதகமான நிலையில் காணலாம். AI அங்கீகரிக்கப்பட்ட அடையாளங்காட்டிகள் மூலம் மட்டுமே அவர்களின் சொந்த ஆன்லைன் கவரேஜைத் தட்டிக் கொள்ளும் திறன் மிகப்பெரியது மற்றும் இணையற்ற கவரேஜை வழங்குகிறது.

படத்தை அடையாளம் காணும் சில பொதுவான பணிகள் இங்கே:-

படத் தரவு சில குறிப்பிட்ட பொருள், அம்சம் அல்லது செயல்பாடு உள்ளதா இல்லையா என்பதை முதலில் நாம் தீர்மானிக்க வேண்டும். இந்த பணியானது பொதுவாக ஒரு மனிதனால் வலுவாகவும் முயற்சியின்றியும் தீர்க்கப்படலாம், ஆனால் பொதுவான விஷயத்திற்கான கணினி பார்வையில் இன்னும் திருப்திகரமாக தீர்க்கப்படவில்லை: தன்னிச்சையான சூழ்நிலைகளில் தன்னிச்சையான பொருள்கள். இந்தச் சிக்கலைக் கையாள்வதற்கான தற்போதைய முறைகள், எளிய வடிவியல் பொருள்கள் (எ.கா., பாலிஹெட்ரா), மனித முகங்கள், அச்சிடப்பட்ட அல்லது கையால் எழுதப்பட்ட எழுத்துக்கள் அல்லது வாகனங்கள் மற்றும் குறிப்பிட்ட சூழ்நிலைகளில், பொதுவாக விதிமுறைகளில் விவரிக்கப்படும் குறிப்பிட்ட பொருள்களுக்கு மட்டுமே சிறந்த தீர்வு காண முடியும். கேமராவுடன் தொடர்புடைய பொருளின் நன்கு வரையறுக்கப்பட்ட வெளிச்சம், பின்னணி மற்றும் போஸ். அங்கீகார சிக்கலின் பல்வேறு வகைகள் இலக்கியத்தில் விவரிக்கப்பட்டுள்ளன:

• பொருள் அங்கீகாரம்

ஒன்று அல்லது பல முன்-குறிப்பிடப்பட்ட அல்லது கற்றறிந்த பொருள்கள் அல்லது பொருள் வகுப்புகள் பொதுவாக படத்தில் உள்ள அவற்றின் 2D நிலைகள் அல்லது காட்சியில் 3D போஸ்கள் ஆகியவற்றுடன் அங்கீகரிக்கப்படலாம்.

• அடையாளம்
ஒரு பொருளின் தனிப்பட்ட நிகழ்வு அங்கீகரிக்கப்படுகிறது. எடுத்துக்காட்டுகள் ஒரு குறிப்பிட்ட நபரின் முகம் அல்லது கைரேகையை அடையாளம் காண்பது அல்லது குறிப்பிட்ட வாகனத்தை அடையாளம் காண்பது.

• கண்டறிதல்
படத் தரவு ஒரு குறிப்பிட்ட நிபந்தனைக்காக ஸ்கேன் செய்யப்படுகிறது. மருத்துவப் படங்களில் சாத்தியமான அசாதாரண செல்கள் அல்லது திசுக்களைக் கண்டறிதல் அல்லது தானியங்கி சாலை கட்டண அமைப்பில் வாகனத்தைக் கண்டறிதல் போன்றவை எடுத்துக்காட்டுகளாகும். ஒப்பீட்டளவில் எளிமையான மற்றும் வேகமான கணக்கீடுகளின் அடிப்படையில் கண்டறிதல் சில சமயங்களில் சுவாரஸ்யமான படத் தரவின் சிறிய பகுதிகளைக் கண்டறியப் பயன்படுகிறது, இது சரியான விளக்கத்தை உருவாக்க அதிக கணக்கீட்டுக் கோரும் நுட்பங்களால் மேலும் பகுப்பாய்வு செய்யப்படலாம்.

அங்கீகாரத்தின் அடிப்படையில் பல சிறப்புப் பணிகள் உள்ளன, அவை:

• உள்ளடக்கம் சார்ந்த பட மீட்டெடுப்பு
ஒரு குறிப்பிட்ட உள்ளடக்கத்தைக் கொண்ட பெரிய படங்களின் தொகுப்பில் உள்ள அனைத்து படங்களையும் இங்கே காணலாம். உள்ளடக்கத்தை வெவ்வேறு வழிகளில் குறிப்பிடலாம், எடுத்துக்காட்டாக, இலக்குப் படத்துடன் தொடர்புடைய ஒற்றுமையின் அடிப்படையில் (படம் X போன்ற அனைத்துப் படங்களையும் எனக்குக் கொடுங்கள்), அல்லது உரை உள்ளீட்டாகக் கொடுக்கப்பட்ட உயர்நிலை தேடல் அளவுகோல்களின் அடிப்படையில் (எனக்கு எல்லாப் படங்களையும் கொடுங்கள். பல வீடுகள், குளிர்காலத்தில் எடுக்கப்படுகின்றன, அவற்றில் கார்கள் இல்லை).

• போஸ் மதிப்பீடு
கேமராவுடன் தொடர்புடைய ஒரு குறிப்பிட்ட பொருளின் நிலை அல்லது நோக்குநிலையை நாம் மதிப்பிட வேண்டும். இந்த நுட்பத்திற்கான ஒரு எடுத்துக்காட்டு பயன்பாடானது, அசெம்பிளி லைன் சூழ்நிலையில் ஒரு கன்வேயர் பெல்ட்டில் இருந்து பொருட்களை மீட்டெடுக்க ஒரு ரோபோவுக்கு உதவுவதாகும்.

• ஆப்டிகல் எழுத்து அங்கீகாரம்
ஓசிஆர் இது அச்சிடப்பட்ட அல்லது கையால் எழுதப்பட்ட உரையின் படங்களில் உள்ள எழுத்துக்களை அடையாளம் காணும், பொதுவாக உரையை மேலும் ஒரு வடிவத்தில் குறியாக்கம் செய்யும் நோக்குடன், மிச்சிகன் மாநில பல்கலைக்கழகத்தின் கணினி அறிவியல் மற்றும் பொறியியல் துறையைத் திருத்த அல்லது அட்டவணைப்படுத்த உதவுகிறது. "பேட்டர்ன் ரெகக்னிஷன் மற்றும் இமேஜ் பிராசஸிங் (பிஆர்ஐபி) ஆய்வக ஆசிரியர்களும் மாணவர்களும் வடிவங்கள் அல்லது பொருட்களை அடையாளம் காண இயந்திரங்களைப் பயன்படுத்துவதை ஆராய்கின்றனர். பொருட்களை உணரவும், அவற்றின் அம்சங்களில் எது அவற்றை மற்றவற்றிலிருந்து வேறுபடுத்துகிறது என்பதைக் கண்டறியவும், வகைப்படுத்தலைச் செய்ய இயந்திரத்தால் பயன்படுத்தக்கூடிய வழிமுறைகளை வடிவமைக்கவும் முறைகள் உருவாக்கப்பட்டுள்ளன. முக்கியமான பயன்பாடுகளில் முகம் அடையாளம் காணுதல், கைரேகை அடையாளம், ஆவணப் பட பகுப்பாய்வு, 3D பொருள் மாதிரி கட்டுமானம், ரோபோ வழிசெலுத்தல் மற்றும் 3D அளவீட்டுத் தரவின் காட்சிப்படுத்தல்/ஆராய்தல் ஆகியவை அடங்கும். தற்போதைய ஆராய்ச்சி சிக்கல்களில் பயோமெட்ரிக் அங்கீகாரம், தானியங்கி கண்காணிப்பு மற்றும் கண்காணிப்பு, ஹேண்ட்லெஸ் HCI, முகம் மாடலிங், டிஜிட்டல் வாட்டர்மார்க்கிங் மற்றும் ஆன்லைன் ஆவணங்களின் கட்டமைப்பை பகுப்பாய்வு செய்தல் ஆகியவை அடங்கும். ஆய்வகத்தின் சமீபத்திய பட்டதாரிகள் கையெழுத்து அங்கீகாரம், கையொப்ப சரிபார்ப்பு, காட்சி கற்றல் மற்றும் படத்தை மீட்டெடுப்பதில் பணியாற்றியுள்ளனர்.

⦁ முக அங்கீகாரம்
பயோமெட்ரிக் தகவலைப் பிரித்தெடுப்பதற்கான வழிமுறையாக முகம் அடையாளம் காணும் அமைப்புகள் படிப்படியாக பிரபலமடைந்து வருகின்றன என்பதை நாங்கள் அறிவோம். பயோமெட்ரிக் அமைப்புகளில் முகம் கண்டறிதல் ஒரு முக்கிய பங்கைக் கொண்டுள்ளது மற்றும் காட்சி கண்காணிப்பு மற்றும் பாதுகாப்பு உள்ளிட்ட பல பயன்பாடுகளுக்கு கவர்ச்சிகரமானதாக உள்ளது. பல்வேறு ஆவணங்களில் முகப் படங்களைப் பொது மக்கள் ஏற்றுக்கொள்வதால், அடுத்த தலைமுறை பயோமெட்ரிக் தொழில்நுட்பமாக மாறுவதற்கு முகத்தை அடையாளம் காணும் திறன் உள்ளது.

பட அங்கீகார அமைப்புகள்

⦁ இயக்க பகுப்பாய்வு
படத்தின் ஒவ்வொரு புள்ளியிலும் அல்லது 3D காட்சியிலும் அல்லது படங்களை உருவாக்கும் கேமராவிலும் கூட வேகத்தின் மதிப்பீட்டை உருவாக்க பட வரிசை செயலாக்கப்படும் இயக்க மதிப்பீட்டுடன் தொடர்புடைய பல பணிகள். அத்தகைய பணிகளின் எடுத்துக்காட்டுகள்:

⦁ ஈகோ இயக்கம்
கேமராவால் தயாரிக்கப்பட்ட பட வரிசையில் இருந்து கேமராவின் 3D திடமான இயக்கத்தை (சுழற்சி மற்றும் மொழிபெயர்ப்பு) தீர்மானித்தல்.

⦁ கண்காணிப்பு
கண்காணிப்பு என்பது பட வரிசையில் (பொதுவாக) சிறிய அளவிலான ஆர்வப் புள்ளிகள் அல்லது பொருள்களின் (எ.கா. வாகனங்கள் அல்லது மனிதர்கள்) இயக்கங்களைப் பின்பற்றுவதாகும்.

⦁ ஆப்டிகல் ஓட்டம்
இது, படத்தின் ஒவ்வொரு புள்ளிக்கும், அந்த புள்ளியானது படத் தளத்துடன் ஒப்பிடும்போது, அதாவது அதன் வெளிப்படையான இயக்கத்துடன் எவ்வாறு நகர்கிறது என்பதைத் தீர்மானிக்க வேண்டும். இந்த இயக்கம் காட்சியில் தொடர்புடைய 3D புள்ளி எவ்வாறு நகர்கிறது மற்றும் காட்சியுடன் ஒப்பிடும்போது கேமரா எவ்வாறு நகர்கிறது என்பதன் விளைவாகும்.

⦁ காட்சி புனரமைப்பு
ஒரு காட்சியின் ஒன்று அல்லது (பொதுவாக) அதிகமான படங்கள் அல்லது ஒரு வீடியோ, காட்சி மறுகட்டமைப்பு காட்சியின் 3D மாதிரியைக் கணக்கிடுவதை நோக்கமாகக் கொண்டுள்ளது. எளிமையான வழக்கில், மாதிரியானது 3D புள்ளிகளின் தொகுப்பாக இருக்கலாம். மிகவும் நுட்பமான முறைகள் முழுமையான 3D மேற்பரப்பு மாதிரியை உருவாக்குகின்றன

⦁ படத்தை மீட்டமைத்தல்
பட மறுசீரமைப்பின் நோக்கம் படங்களிலிருந்து சத்தத்தை (சென்சார் சத்தம், இயக்க மங்கலானது போன்றவை) அகற்றுவதாகும். சத்தத்தை அகற்றுவதற்கான எளிய அணுகுமுறை, குறைந்த-பாஸ் வடிகட்டிகள் அல்லது சராசரி வடிகட்டிகள் போன்ற பல்வேறு வகையான வடிப்பான்கள் ஆகும். மேலும் அதிநவீன முறைகள், உள்ளூர் பட கட்டமைப்புகள் எப்படி இருக்கும் என்பதற்கான மாதிரியை எடுத்துக்கொள்கிறது, இது சத்தத்திலிருந்து அவற்றை வேறுபடுத்துகிறது. கோடுகள் அல்லது விளிம்புகள் போன்ற உள்ளூர் பட அமைப்புகளின் அடிப்படையில் படத் தரவை முதலில் பகுப்பாய்வு செய்வதன் மூலம், பகுப்பாய்வுப் படியிலிருந்து உள்ளூர் தகவலின் அடிப்படையில் வடிகட்டலைக் கட்டுப்படுத்துவதன் மூலம், எளிமையான அணுகுமுறைகளுடன் ஒப்பிடும்போது ஒரு சிறந்த அளவிலான இரைச்சல் நீக்கம் பொதுவாக பெறப்படுகிறது. இந்த துறையில் ஒரு உதாரணம் அவர்களின் ஓவியம். சில அமைப்புகள் ஒரு குறிப்பிட்ட அளவீடு அல்லது கண்டறிதல் சிக்கலைத் தீர்க்கும் தனித்த பயன்பாடுகளாகும், மற்றவை ஒரு பெரிய வடிவமைப்பின் துணை அமைப்பாகும், எடுத்துக்காட்டாக, இயந்திர இயக்கிகள், திட்டமிடல், தகவல் தரவுத்தளங்கள், மனிதன்- ஆகியவற்றைக் கட்டுப்படுத்துவதற்கான துணை அமைப்புகளையும் கொண்டுள்ளது இயந்திர இடைமுகங்கள், முதலியன. ஒரு கணினி பார்வை அமைப்பின் குறிப்பிட்ட செயல்படுத்தல் அதன் செயல்பாடு முன்னரே குறிப்பிடப்பட்டதா அல்லது செயல்பாட்டின் போது அதன் சில பகுதியைக் கற்றுக் கொள்ள முடியுமா அல்லது மாற்றியமைக்க முடியுமா என்பதைப் பொறுத்தது. இருப்பினும், பல கணினி பார்வை அமைப்புகளில் காணப்படும் பொதுவான செயல்பாடுகள் உள்ளன.

பட அங்கீகாரத்துடன் ஆழமான கற்றல்

AI க்கு முன்பே பட அங்கீகாரம் இருந்தது. இன்னும் இயந்திர கற்றல் காரணி ஒரு பொருள் அல்லது நபரின் முகத்தை அடையாளம் காணும் முறைகளில் புரட்சியை ஏற்படுத்துகிறது. எவ்வாறாயினும், எந்திரக் கற்றல் அதற்கு உணவளிக்க தரவு இருக்கும்போது மட்டுமே பயனுள்ளதாக இருக்கும். AI இன் அனைத்து ஆட்டோமேஷனுக்கும், படங்களை அடையாளம் காண பணிப்பது எளிமையான கோரிக்கை அல்ல. காட்சிகள் பற்றிய நமது புரிதல் இரண்டாவது இயல்பு; இது நாம் சிறு வயதிலிருந்தே திட்டமிடப்பட்ட ஒன்று. ஒரு இயந்திரத்திடம் அதையே கேட்பது ஒரு நேரடியான செயல் அல்ல. அந்த காரணத்திற்காக, AI அங்கீகாரத்தின் மிகவும் பிரபலமான வடிவங்களில் ஒன்று கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகள் (CNN) ஆகும். CNN என்பது ஒன்றோடொன்று அமைந்துள்ள பிக்சல்களில் கவனம் செலுத்தும் ஒரு முறையாகும். நெருக்கமாக அமைந்துள்ள படங்கள் தொடர்புடையதாக இருக்கும், அதாவது ஒரு பொருள் அல்லது முகம் அதிக வெளிப்படைத்தன்மையுடன் படத்துடன் பொருந்துகிறது.
AI பட அங்கீகாரம் தெளிவான பலன்களைக் கொண்டிருந்தாலும், சமூக ஊடகங்களைப் பணமாக்க விரும்பும் பிராண்டுகள், அதன் பயன்பாட்டு வழக்குகள் மிகவும் ஆழமாக இயங்குகின்றன. ஆட்டோமொபைல் உலகில் சுய-ஓட்டுநர் கார்கள் அடுத்த பெரிய விஷயமாக இருக்கப் போகிறது, மேலும் AI பட அங்கீகார தொழில்நுட்பம் அவற்றை இயக்க உதவுகிறது. சாலையில் செல்லும் பொருட்களையும் மக்களையும் கண்டறிவதால், அவர்கள் மீது மோதாமல் இருக்கக்கூடிய சுய-ஓட்டுநர் கார் தானாகவே நடக்காது. தகவலறிந்த முடிவுகளை எடுக்க அது படங்களை அங்கீகரிக்க வேண்டும். ஒவ்வொரு சுய-ஓட்டுநர் காரிலும் பல சென்சார்கள் பொருத்தப்பட்டிருப்பதால், அது மற்ற நகரும் வாகனங்கள், சைக்கிள் ஓட்டுபவர்கள், மக்கள் - அடிப்படையில் ஆபத்தை ஏற்படுத்தக்கூடிய எதையும் அடையாளம் காண முடியும். ஒரு தானியங்கு கார், ஒரு அனுபவமுள்ள ஓட்டுநர் செய்யும் அதே வழியில் சாலையின் அபாயங்களைச் செயல்படுத்த வேண்டும். 2020 ஆம் ஆண்டில் சுய-ஓட்டுநர் கார்கள் சாலைக்கு வருவதற்கு முன் இன்னும் சில அம்சங்கள் உள்ளன. ஆனால் வாகன ஆட்டோமேஷன் கிக்-இன் செய்யும் போது, AI பட அங்கீகாரம் அவர்களுக்குப் பின்னால் பாதுகாப்பாக வேலை செய்யும் முக்கிய இயக்கிகளில் ஒன்றாக இருக்கும்.
⦁ படம் கையகப்படுத்தல்
டிஜிட்டல் படம் ஒன்று அல்லது பல பட உணரிகளால் தயாரிக்கப்படுகிறது, இதில் பல்வேறு வகையான ஒளி-உணர்திறன் கேமராக்கள் தவிர, ரேஞ்ச் சென்சார்கள், டோமோகிராபி சாதனங்கள், ரேடார், அல்ட்ரா-சோனிக் கேமராக்கள் போன்றவை அடங்கும். சென்சாரின் வகையைப் பொறுத்து, படத் தரவு ஒரு சாதாரண 2D படம், ஒரு 3D தொகுதி அல்லது ஒரு பட வரிசை. பிக்சல் மதிப்புகள் பொதுவாக ஒன்று அல்லது பல நிறமாலை பட்டைகளில் (சாம்பல் படங்கள் அல்லது வண்ணப் படங்கள்) ஒளியின் தீவிரத்தை ஒத்திருக்கும், ஆனால் ஒலி அல்லது மின்காந்த அலைகளின் ஆழம், உறிஞ்சுதல் அல்லது பிரதிபலிப்பு அல்லது அணு காந்த அதிர்வு போன்ற பல்வேறு உடல் அளவீடுகளுடன் தொடர்புடையதாக இருக்கலாம்.
⦁ முன் செயலாக்கம்:
சில குறிப்பிட்ட தகவலைப் பிரித்தெடுப்பதற்காக, கணினி பார்வை முறையைப் படத் தரவுகளுக்குப் பயன்படுத்துவதற்கு முன், அந்த முறையின் மூலம் குறிப்பிடப்படும் சில அனுமானங்களை அது திருப்திப்படுத்துகிறது என்பதை உறுதிப்படுத்த, வழக்கமாக தரவைச் செயலாக்குவது அவசியம். எடுத்துக்காட்டுகள்
1. பட ஒருங்கிணைப்பு அமைப்பு சரியானது என்பதை உறுதிப்படுத்த மறு மாதிரி.
2. சென்சார் சத்தம் தவறான தகவலை அறிமுகப்படுத்தாது என்பதை உறுதி செய்வதற்காக இரைச்சல் குறைப்பு.
3. தொடர்புடைய தகவலைக் கண்டறிய முடியும் என்பதை உறுதிப்படுத்த, மாறுபாடு மேம்பாடு.
4. உள்நாட்டில் பொருத்தமான அளவீடுகளில் பட கட்டமைப்புகளை மேம்படுத்துவதற்கான அளவு-வெளி பிரதிநிதித்துவம்.
⦁ அம்சம் பிரித்தெடுத்தல்:
சிக்கலான பல்வேறு நிலைகளில் உள்ள பட அம்சங்கள் படத் தரவிலிருந்து பிரித்தெடுக்கப்படுகின்றன. அத்தகைய அம்சங்களின் பொதுவான எடுத்துக்காட்டுகள் கோடுகள், விளிம்புகள் மற்றும் முகடுகள்
மூலைகள், குமிழ்கள் அல்லது புள்ளிகள் போன்ற உள்ளூர்மயமாக்கப்பட்ட ஆர்வப் புள்ளிகள். மிகவும் சிக்கலான அம்சங்கள் அமைப்பு, வடிவம் அல்லது இயக்கத்துடன் தொடர்புடையதாக இருக்கலாம்.
⦁ கண்டறிதல்/பிரிவு:
செயலாக்கத்தின் ஒரு கட்டத்தில், மேலும் செயலாக்கத்திற்கு எந்தப் படப் புள்ளிகள் அல்லது படத்தின் பகுதிகள் பொருத்தமானவை என்பது பற்றிய முடிவு எடுக்கப்பட்டது. எடுத்துக்காட்டுகள்
1. குறிப்பிட்ட வட்டி புள்ளிகளின் தேர்வு
2. ஆர்வமுள்ள ஒரு குறிப்பிட்ட பொருளைக் கொண்டிருக்கும் ஒன்று அல்லது பல படப் பகுதிகளின் பிரிவு.
⦁ உயர்நிலை செயலாக்கம்:
இந்த கட்டத்தில் உள்ளீடு பொதுவாக ஒரு சிறிய தரவுத் தொகுப்பாகும், எடுத்துக்காட்டாக, ஒரு குறிப்பிட்ட பொருளைக் கொண்டிருப்பதாகக் கருதப்படும் புள்ளிகளின் தொகுப்பு அல்லது அனிமேஜ் பகுதி. மீதமுள்ள செயலாக்கம், எடுத்துக்காட்டாக:
1. தரவு மாதிரி அடிப்படையிலான மற்றும் பயன்பாட்டு விவரக்குறிப்புகளை திருப்திப்படுத்துகிறது என்பதை சரிபார்த்தல்.
2. ஆப்ஜெக்ட் போஸ் அல்லது ஆப்ஜெக்ட் அளவு போன்ற பயன்பாட்டு குறிப்பிட்ட அளவுருக்களின் மதிப்பீடு.
3. கண்டறியப்பட்ட பொருளை வெவ்வேறு வகைகளாக வகைப்படுத்துதல். எனவே, படத்தை அடையாளம் காணவும், பட அடையாளத்தின் படி பதிலளிக்கவும் பட செயலாக்கம் AI க்கு உதவுகிறது.

படங்களின் தடையற்ற எதிர்காலம்

தொழில்நுட்பம் மேம்படும் போது, பட அங்கீகாரம் இன்னும் சிறந்த முடிவுகளைத் தரும். லோப்ஸ்டரில் இயந்திர கற்றல் தலைவர் விளாடிமிர் பாவ்லோவ் கூறுகிறார், "பொருள் அங்கீகாரத்திற்கான கணித அடிப்படை நீண்ட காலமாக உள்ளது, ஆனால் கணினி பார்வை அல்காரிதம்களைப் பயன்படுத்துவதற்கான தொழில்நுட்ப சாத்தியங்கள் சமீபத்தில் தோன்றின. ஏற்கனவே, நரம்பியல் நெட்வொர்க்குகள் மனிதர்களை விட சிறப்பாக செயல்படும் திறன் கொண்ட சரியான கண்டுபிடிப்பாளர்களை உருவாக்க அனுமதிக்கின்றன. ஒரு பெரிய முட்டாள் பயிற்சிக்கான குறிக்கப்பட்ட பட தரவுத்தொகுப்புகளின் இருப்பைத் தடுக்கிறது, ஆனால் எதிர்காலத்தில், இது ஒரு பிரச்சனையாக இருக்காது. கம்ப்யூட்டர் விஷன் இன்ஜினியர்கள் சுய-கற்றல் அல்காரிதம்களில் தீவிரமாக வேலை செய்கிறார்கள். "எதிர்காலம் காட்சித் தொடர்புகளால் பெரிதும் பாதிக்கப்படுவதால், நாம் பார்க்கும் பல படங்களுக்குப் பின்னால் உள்ள முக்கிய காரணியாக பட அங்கீகாரம் இருக்கும். நிஜ வாழ்க்கையிலும் ஆன்லைனிலும்.