פארוואס בילד דערקענונג וויכטיק?

אַרום 80% פון די מאַטעריע אויף די וועב איז וויזשאַוואַל. איר וואָלט שוין קענען אָנהייבן צו רעכענען אויס וואָס בילד לייבלינג קען האַלטן זיין אָרט ווי האר פון די סאַבסטאַנסיז טיש. ניט געקוקט אויף צי עס זענען מענטשן אָדער אָרגאַנאַזיישאַנז, אַי בילד דערקענונג האט געמאכט עס מעגלעך צו ויסטיילן וויזשוואַלז אָנליין מיט נישטיק אַבדזשעקץ. אַרום 657 ביליאָן פאָוטאַגראַפס פּאָסטעד יעדער יאָר קערפאַלי, מיט דער גרעסטער טייל געוויזן דורך אָנליין מידיאַ. א לייַטיש שטיק פון די בילדער זענען מענטשן וואָס העכערן זאכן, ראַגאַרדלאַס פון צי זיי טאָן דאָס אַקסאַדענאַלי. קליענט געשאפן אינהאַלט (UGC) אין זיין מערסט שליימעסדיק סטרוקטור איז אַ בריליאַנט ימפּאַוערינג השפּעה פֿאַר בראַנדז ווייַל עס גיט די מערסט ידעאַל סאָרט פון העכערונג.

עס זענען גאַנצע דעוויסעס צו שרעק אָרגאַנאַזיישאַנז ווען עס איז אַ קוינע באַמערקן דורך אָנליין מידיאַ, אָבער זאָל ניט זיין געזאָגט וועגן ווען בראַנדז העכערונג כאַפּאַנז אָן ווער עס יז לייבלינג זייער נאָמען אין די געזעלשאַפטלעך פּאָסטן? דאָס איז דער אָרט ווו אַי בילד דערקענונג דעמאַנסטרייץ זייַן ווערט. אויף די אַוועק געלעגנהייַט אַז די טעק איז גענומען זאָרגן פון די רעכט דאַטאַסעץ, אַי קענען ויסטיילן אַ בילד אָן יקספּליסאַט פירמע רעפערס צו. די אַוטקאַמז זענען וויכטיק פֿאַר בראַנדז צו שפּור און נאָכגיין זייער געזעלשאַפטלעך נאָוטיסאַז.

ווי טוט בילד דערקענונג אַרבעט?

ווי מיר מיסטאָמע וויסן, אַי קענען קוקן דורך וועב-באזירט מידיאַ סטאַגעס זוכן פֿאַר פאָוטאַגראַפס און קאַנטראַסט זיי מיט ברייט ינפאָרמאַטיוו זאַמלונגען. עס אין דעם פונט טשוזיז פּערטינאַנט בילד וואָס שוועבעלעך אין אַ קורס פיל פאַסטער ווי מענטשן זענען ביכולת צו טאָן. בראַנדז נוצן בילד דערקענטעניש צו אַנטדעקן אינהאַלט ווי זייער אייגענע דורך וועב-באזירט מידיאַ. דאָס ימפּלייז דיסטינגגווישינג די לאָגאָ פון אַ סאָרט אָדער באמערקט אַ נאַטירלעך פּאַזישאַנד פּאָזיציע צווישן וועב-באזירט מידיאַ קלייאַנץ. ריקוועסטינג אַז מענטשן פיש דורך אַזאַ אַ פּלאַץ פון דאַטן יפעקטיוולי ווערט טיירינג. סימיאַלייטיד סייכל טוט נישט דרוק איבער די מענטש בלענדער, און קערט פּינטלעך אַוטקאַמז אין גלייַכן לעוועלס. קינסטלעך סייכל בילד דערקענטעניש סקרינז וואָס מענטשן זאָגן וועגן אַ סאָרט אָן די פאָדערונג פֿאַר טעקסט. בראַנדז גרייט צו נאָכפאָלגן זייער געזעלשאַפטלעך נאָוטיסאַז אָן קלייאַנץ וואָס דערוואַרטן צו אַרייַן די נאָמען פון די אָרגאַניזאַציע וועט זיין אין אַן ינוואַליאַבאַל שטעלע. די מעגלעכקייט צו נוצן זייער אייגענע אָנליין ינקלוזשאַן אויסשליסלעך דורך אַי דערקענט ידענטיפיערס איז גוואַלדיק און אָפפערס אַנרייוואַלד ינקלוזשאַן.

דאָ זענען עטלעכע פּראָסט עראַנדז פון בילד דערקענונג: -

פון די אָנהייב מיר דאַרפֿן צו באַשליסן אויב די בילד אינפֿאָרמאַציע כּולל אַ באַזונדער אַרטיקל, הויכפּונקט אָדער באַוועגונג. די אַסיינמאַנט קענען טיפּיקלי זיין גערעדט האַרציק און אָן יגזערשאַן דורך אַ מענטש, אָבער איז נאָך נישט גענוג טאַקאַלד אין פּיסי זעאונג פֿאַר די קוילעלדיק פאַל: זיך-אַסערטיוו אַרטיקלען אין דיסקרעשאַנערי צושטאנדן. די איצטיקע טעקניקס פֿאַר אָנפירונג דעם אַרויסגעבן קענען זיין בעסטער טאַקאַלד בלויז פֿאַר יקספּליסאַט ארטיקלען, למשל, יקערדיק מאַטאַמאַטיקאַל זאכן (למשל, פּאָליהעדראַל), מענטש פנימער, געדרוקט אָדער טראַנסקריבעד אותיות, אָדער וועהיקלעס, און אין יקספּליסאַט צושטאנדן, נאָרמאַלי געשילדערט ווי ווייַט ווי אַלע אַרום קעראַקטערייזד ברייטנינג, יסוד, און האַלטנ זיך פון די נומער קאָמפּאַראַטיווע מיט די אַפּאַראַט. פאַרשידן אַסאָרטמאַנץ פון די דערקענטעניש אַרויסגעבן זענען געשילדערט אין דעם שרייבן:

• אָבדזשעקט דערקענונג

איינער אָדער עטלעכע פאַר-באשלאסן אָדער געלערנט אַרטיקלען אָדער נומער קלאסן קענען זיין באמערקט, נאָרמאַלי צוזאַמען מיט זייער 2 ד סיטואַטיאָנס אין די בילד אָדער 3 ד שטעלעס אין דער סצענע.

• לעגיטימאַציע

אַ יחיד פאַל פון אַן אַרטיקל איז באמערקט. מאָדעלס זענען דיסטינגגווישינג דערווייַז פון אַ באַזונדער מענטש ס פּנים אָדער יינציק צייכן, אָדער ID פון אַ באַזונדער פאָרמיטל.

• דעטעקשאַן

די בילד אינפֿאָרמאַציע איז יגזאַמאַנד פֿאַר אַ באַזונדער צושטאַנד. מאָדעלס זענען אנטדעקונג פון קאַנסיוואַבאַל מאָדנע סעלז אָדער געוועבן אין קליניש בילדער אָדער דערקענונג פון אַ פאָרמיטל אין אַ פּראָוגראַמד גאַס קאָס פריימווערק. ופדעקונג אָפענגיק אויף מעסיק פּשוט און שנעל חשבונות איז דאָ און דאָרט געניצט פֿאַר דערגייונג מער באַשיידן דיסטריקץ פון ינטריגינג בילד אינפֿאָרמאַציע וואָס קענען זיין אַדישנאַלי צעבראכן דורך מער קאַמפּיוטיישאַנאַל ריקוועסטינג סטראַטעגיעס צו שאַפֿן אַ רעכט איבערזעצונג.

עס זענען עטלעכע באַזונדער אונטערנעמונגען אָפענגיק אויף דערקענטעניש, למשל,

• אינהאַלט-באזירט בילד אָפּזוך

דאָ אַנטדעקן אַלע בילדער אין אַ גרעסערע אָרדענונג פון בילדער וואָס האָבן אַ באַזונדער מאַטעריע. די מאַטעריע קענען זיין באשלאסן אויף אַ אומגעריכט וועג, פֿאַר בייַשפּיל ווי פיל ווי אַ קאָרעוו אַ אָביעקטיוו בילד (געבן מיר אַלע בילדער ווי בילד X), אָדער ווי ווייַט ווי באַטייַטיק יאָג סטאַנדאַרדס געגעבן ווי טעקסט אַרייַנשרייַב (געבן מיר אַלע בילדער וואָס כּולל פילע הייזער, זענען גענומען בעשאַס ווינטער, און האָבן קיין וועהיקלעס אין זיי).

• פּאָזע אַססעססמענט

מיר דאַרפֿן צו מאָס די שטעלע אָדער ריכטונג פון אַ באַזונדער אַרטיקל קאָמפּאַראַטיווע מיט דער אַפּאַראַט. א מאָדעל אַפּלאַקיישאַן פֿאַר דעם סטראַטעגיע וואָלט העלפֿן אַ ראָבאָט צו צוריקקריגן זאכן פון אַ אַריבערפירן שורה אין אַ מאַקאַניקאַל פּראָדוקציע סיסטעם.

• אָפּטיש כאַראַקטער דערקענטעניש

OCR וואָס איז דיסטינגגווישינג אותיות אין בילדער פון געדרוקט אָדער מאַניואַלי געשריבן אינהאַלט, מערסטנס מיט די סוף ציל פון קאָדירונג די אינהאַלט אין אַן אָרגאַניזאַציע מער און ימפּאַוער צו טוישן אָדער אָרדערינג דעפּאַרטמענט פון קאָמפּיוטער וויסנשאַפֿט און אינזשעניריע, מישיגן שטאַט אוניווערסיטעט. סטראַטעגיעס זענען באשאפן צו דעטעקט אַבדזשעקץ, צו געפֿינען וואָס פון זייער כיילייץ דערקענען זיי פון אנדערע, און צו פּלאַן חשבונות וואָס קענען זיין יוטאַלייזד דורך אַ מאַשין צו מאַכן די כאַראַקטעריזיישאַן. באַטייטיק אַפּלאַקיישאַנז ינקאָרפּערייט פּנים דערקענטעניש, רעקאַגנייזאַבאַל דערווייַז פון פינגער רושם, רעקאָרד בילד דורכקוק, 3 ד אַרטיקל מאָדעל אַנטוויקלונג, ראָבאָט מאַרשרוט און פאַרטרעטונג / ויספאָרשונג פון 3 ד וואָלומעטריק אינפֿאָרמאַציע. Ebb און פלאָו פאָרשונג ישוז ינקאָרפּערייט ביאָמעטריק באַשטעטיקונג, פּראָוגראַמד אָבסערוואַציע און ווייַטערדיק, כאַנדלאַס HCI, פּנים ווייַז, קאַמפּיוטערייזד וואָטערמאַרקינג און יגזאַמאַנד פּלאַן פון אָנליין אַרקייווז. שפּעט אַלאַמניי פון די לאַבאָראַטאָריע האָבן דעלט מיט דערקענונג פון פּענמאַנשיפּ, כסימע טשעק, וויזשאַוואַל לערנען און בילד אָפּזוך.

מאָדעל:

מיר זאָל זען אַז עס נעמט אַ ביסל בילדצעלן פון דאַטן צו האָבן די אָפּציע צו דערקענען די ונטערטעניק פון אַ בילד, אַ גרופּע פארטריבן דורך אַ MIT מומכע האט געפֿונען. די אנטפלעקונג קען אָנמאַכן ויסערגעוויינלעך אַדוואַנסיז אין די מעקאַנייזד רעקאַגנייזאַבאַל דערווייַז פון אָנליין בילדער און, לעסאָף, געבן אַ האַנאָכע צו פּיסי צו זען ווי מענטשן טאָן. אָנפירונג פון אַ ספּעציעל קורץ בילד וואָלט זיין אַ באַטייטיק שטייַגן צו מאַכן עס מעגלעך צו ינקאָרפּערייט די ביליאַנז פון בילדער אויף דער אינטערנעץ. איצט, די איינציקע צוגאַנג צו קוקן פֿאַר בילדער אָפענגען אויף אינהאַלט ינסקריפּשאַנז וואָס יחידים האָבן אריין מיט האַנט פֿאַר יעדער בילד, און פילע בילדער דאַרפֿן אַזאַ דאַטן. פּראָגראַממעד שייַן וואָלט אויך געבן אַ וועג צו טעקע בילדער מענטשן אראפקאפיע פֿון קאַמפּיוטערייזד קאַמעראַס אויף זייער פּיסי, אָן דערפאַרונג און סאַבטייטאַל יעדער פון זיי. אויך, לעסאָף, עס קען אָנווייַזן עכט מאַשין זעאונג, וואָס קען אַמאָל דערלויבן ראָובאַץ צו סאָרט אויס די אינפֿאָרמאַציע וואָס קומט פון זייער קאַמעראַס און סאָרט אויס ווו זיי זענען. אַזוי אַז אויב צוויי בילדער האָבן אַ פאַרגלייַכלעך גרופּינג [פון נומערן], זיי זענען מאַשמאָעס קאָמפּאַראַטיווע געמאכט פון בכלל אַ ענלעך אַרטיקל, אין אַלגעמיין אַ ענלעך אָרדענונג. ” אויב איין בילד איז געווען שייַכות צו אַ ינסקריפּשאַן אָדער טיטל, אין דעם פונט, פאַרשידענע בילדער וואָס קאָואָרדאַנאַט זיין מאַטאַמאַטיקאַל קאָד וואָלט מיסטאָמע ווייַזן אַ ענלעך נומער, (למשל, אַ פאָרמיטל, בוים אָדער יחיד), אַזוי דער נאָמען וואָס איז פארבונדן מיט איין בילד קען זיין אריבערגעפארן צו די אנדערע. "מיט אַ פּלאַץ פון בילדער, אפילו פּשוט חשבונות קענען זיין טאַקע גוט" צו דערקענען בילדער אַזוי.

⦁ פאַסיאַל דערקענונג

מיר פאַרשטיין אַז פראַמעוואָרקס פֿאַר דערקענונג פון פּנים זענען קאַנטיניואַסלי באַרימט ווי מעטהאָדס פֿאַר רימוווינג ביאָמעטריק דאַטן. פּנים דערקענטעניש האט אַ יקערדיק טייל אין ביאָמעטריק פראַמעוואָרקס און איז אַלורינג פֿאַר פאַרשידן אַפּלאַקיישאַנז אַרייַנגערעכנט וויזשאַוואַל ריקאַנאַסאַנס און זיכערהייט. אין ליכט פון די קוילעלדיק באַפעלקערונג דערקענטעניש פון פּנים בילדער אויף פאַרשידענע ריפּאָרץ, פּנים דערקענטעניש האט אַ גלייבן פּאָטענציעל צו ווענדן אין די קאַטינג ברעג ביאָמעטריק כידעש פון באַשלוס.

בילד רעקאָגניטיאָן סיסטעמען

⦁ באַוועגונג דורכקוק

עטלעכע אַסיינמאַנץ ידענטיפיצירן זיך מיט באַוועגונג אַסעסמאַנט ווו אַ בילד סאַקסעשאַן איז צוגעגרייט צו מאַכן אַ מאָס פון די גיכקייַט אָדער ביי יעדער פאָוקיסיז אין די בילד אָדער אין די 3 ד סצענע, אָדער אפילו פון די אַפּאַראַט וואָס דיליווערז די בילדער. קאַסעס פון אַזאַ אַסיינמאַנץ זענען:

⦁ עגאָ באַוועגונג

באַשליסן די 3 ד ינפלעקסאַבאַל באַוועגונג (דרייווינג און ינטערפּריטיישאַן) פון די אַפּאַראַט פֿון אַ בילד סאַקסעשאַן באשאפן דורך די אַפּאַראַט.

⦁ טראַקינג

נאָך די דיוועלאַפּמאַנץ פון אַ (בכלל) מער באַשיידן אָרדענונג פון אינטערעס פאָוקיסיז אָדער פראטעסטן (למשל, וועהיקלעס אָדער מענטשן) אין די בילד סאַקסעשאַן.

⦁ אָפּטיש טייַך

דאָס איז צו באַשליסן, פֿאַר יעדער פונט אין די בילד, ווי אַז פונט איז מאָווינג קאָמפּאַראַטיווע מיט די בילד פלאַך, ד"ה, זייַן קענטיק באַוועגונג. די באַוועגונג איז אַ רעזולטאַט פון ווי די קאַמפּערינג 3 ד פונט איז מאָווינג אין די סצענע און ווי דער אַפּאַראַט איז מאָווינג קאַמפּעראַטיוו מיט די סצענע.

⦁ סצענע רימאַקינג

געגעבן איינער אָדער (נאָרמאַלי) מער בילדער פון אַ סצענע, אָדער אַ ווידעא, סצענע רעפּראָדוקציע טאַרגאַץ רעדזשיסטערינג אַ 3 ד מאָדעל פון די סצענע. אין די יזיאַסט פאַל די מאָדעל קענען זיין אַ בינטל פון 3 ד פאָוקיסיז. מער ראַפינירט סטראַטעגיעס פּראָדוצירן אַ גאַנץ 3 ד ייבערפלאַך מאָדעל

⦁ בילד ריבילדינג

די פונט פון בילד ריבילדינג איז די יוואַקיאַוויישאַן פון גערודער (סענסאָר קלאַמער, באַוועגונג טונקל, און אַזוי אויף) פון בילדער. דער קלענסטער קאָמפּלעקס קאַנסיוואַבאַל מעטאַדאַלאַדזשי פֿאַר גערודער יקספּאַלשאַן איז פאַרשידענע סאָרץ פון טשאַנאַלז, למשל, נידעריק-פאָרן טשאַנאַלז אָדער מיטל טשאַנאַלז. מער מאָדערן סטראַטעגיעס דערוואַרטן אַ מאָדעל פון ווי די קוואַרטאַל בילד סטראַקטשערז ריזעמבאַל, אַ מאָדעל וואָס אנערקענט זיי פון די גערודער. דורך ערשטער ויספאָרשן די בילד אינפֿאָרמאַציע אין אַ לאַנג צייַט פון די נירביי בילד סטראַקטשערז, למשל, שורות אָדער עדזשאַז, און דערנאָך קאַנטראָולינג די סעפּערייטינג אָפענגיק אויף קוואַרטאַל דאַטן פון די דורכקוק שריט, אַ העכער גראַד פון גערודער יוואַקיאַוויישאַן איז בכלל באַקומען קאַנטראַסט מיט די ווייניקערע. קאָמפּלעקס מעטאַדאַלאַדזשיז. א מאָדעל אין דעם פעלד איז זייער געמעל. עטלעכע פראַמעוואָרקס זענען פרייַ אַפּלאַקיישאַנז וואָס אַדרעס אַ באַזונדער אָפּשאַצונג אָדער דערקענונג אַרויסגעבן, בשעת אנדערע אַרייַננעמען אַ סאַב-אָרדענונג פון אַ גרעסערע פּלאַן וואָס, למשל, אויך כּולל סאַב-פראַמעוואָרקס פֿאַר קאָנטראָל פון מעטשאַניקאַל אַקטוייטערז, אָרדענונג, דאַטן אינפֿאָרמאַציע באַסעס, מאַשין ינטערפייסיז, און אַזוי אויף די באַזונדער דורכפירונג פון אַ פּיסי זעאונג פריימווערק אויך דעפּענדס אויף אויב זייַן נוציקייט איז פאַר-באשלאסן אָדער אויב עטלעכע טייל פון עס קענען זיין געלערנט אָדער אַדזשאַסטיד בעשאַס אַקטיוויטעטן. עס זענען, ווי עס קען, רעגולער קייפּאַבילאַטיז וואָס זענען געפֿונען אין פילע פּיסי זעאונג