Hvorfor er billedgenkendelse vigtig?

Omkring 80 % af stoffet på nettet er visuelt. Du ville allerede være i stand til at begynde at finde ud af, hvorfor billedmærkning kan holde sin plads som herre over stofbordet. Uanset om det er mennesker eller organisationer, har AI billedgenkendelse gjort det muligt at skelne visuelle online med ubetydelige objekter. Der bliver omkring 657 milliarder billeder postet hvert år omhyggeligt, hvor størstedelen dukker op via onlinemedier. Et anstændigt stykke af disse billeder er individer, der fremfører genstande, uanset om de gør det ved et uheld. Klientproduceret indhold (UGC) i sin mest perfekte struktur er en strålende styrkende indflydelse for brands, da det giver den mest ideelle form for avancement.

Der er reklameanordninger til at alarmere organisationer, når der er en købermeddelelse via onlinemedier, men bør der ikke siges noget om, hvornår brands avancement sker, uden at nogen skriver deres navn i det sociale indlæg? Dette er stedet, hvor AI-billedgenkendelse viser sit værd. Hvis teknologien bliver taget hånd om de rigtige datasæt, kan AI skelne et billede uden en eksplicit etiket, der henviser til. Resultaterne er vigtige for brands at spore og følge deres sociale meddelelser.

Hvordan fungerer billedgenkendelse?

Som vi sandsynligvis er klar over, kan AI se gennem webbaserede mediestadier og søge efter fotografier og kontrastere dem med brede informationssamlinger. Den vælger på det tidspunkt et relevant billede, der matcher med en hastighed, der er meget hurtigere, end folk er i stand til at gøre. Brands bruger billedgenkendelse til at opdage indhold som deres eget via webbaserede medier. Det indebærer, at man skelner mellem et brands logo eller opfatter naturligt placerede varesituationer blandt webbaserede mediekunder. At anmode om, at folk fisker gennem så mange data, bliver effektivt trættende. Simuleret intelligens stresser ikke over den menneskelige bommert og returnerer nøjagtige resultater på uovertrufne niveauer. Billedbekræftelse med kunstig intelligens screener, hvad enkeltpersoner siger om et mærke uden krav om tekst. Mærker, der er klar til at følge deres sociale meddelelser, uden at kunderne forventer at skrive organisationens navn, vil ende i en uvurderlig position. Muligheden for at drage fordel af deres egen online-inkludering udelukkende gennem AI-opfattede identifikatorer er enorm og tilbyder uovertruffen inklusion.

Her er nogle almindelige ærinder med billedgenkendelse: -

Fra begyndelsen skal vi beslutte, om billedinformationen indeholder en bestemt artikel, fremhævning eller bevægelse. Denne opgave kan typisk løses hjerteligt og uden anstrengelse af et menneske, men er endnu ikke taklet tilstrækkeligt i pc-vision til den overordnede sag: selvhævdende artikler under skønsmæssige omstændigheder. De nuværende teknikker til at håndtere dette problem kan bedst håndteres kun for eksplicitte artikler, for eksempel grundlæggende matematiske elementer (f.eks. polyedriske), menneskelige ansigter, trykte eller transskriberede tegn eller køretøjer, og under eksplicitte omstændigheder, normalt portrætteret så vidt som alle omkring karakteriseret lysning, fundament og holdning af emnet sammenlignende med kameraet. Forskellige sortimenter af anerkendelsesproblemet er portrætteret i skriften:

• Objektgenkendelse

En eller nogle få forudbestemte eller lærte artikler eller emneklasser kan opfattes, normalt sammen med deres 2D-situationer i billedet eller 3D-stillinger i scenen.

• Identifikation

Et individuelt tilfælde af en artikel opfattes. Modeller er kendetegnende bevis for en bestemt persons ansigt eller unikke mærke eller ID for et bestemt køretøj.

• Detektion

Billedinformationen undersøges for en bestemt tilstand. Modeller er opdagelse af tænkelige mærkelige celler eller væv i kliniske billeder eller genkendelse af et køretøj i en programmeret gadeomkostningsramme. Opdagelse afhængig af moderat ligetil og hurtige beregninger bruges her og der til at finde mere beskedne distrikter af spændende billedinformation, som yderligere kan nedbrydes ved hjælp af mere beregningsmæssigt anmodende strategier til at skabe en rigtig oversættelse.

Der findes nogle få særlige virksomheder, der er afhængige af anerkendelse, f.eks.

• Indholdsbaseret billedgendannelse

Her opdager du alle billeder i et større arrangement af billeder, som har en bestemt substans. Stoffet kan bestemmes på en uventet måde, for eksempel for så vidt angår lighed i forhold til et objektivt billede (giv mig alle billeder som billede X), eller for så vidt angår forfølgelsesstandarder på signifikant niveau givet som tekstinput (giv mig alle billeder, der indeholder talrige huse, tages om vinteren og har ingen køretøjer i dem).

• Positionsvurdering

vi er nødt til at måle positionen eller retningen af ​​en bestemt artikel sammenlignet med kameraet. En modelansøgning til denne strategi vil hjælpe en robot med at genvinde genstande fra en transportlinje i et mekanisk produktionssystem.

• Optisk tegnbekræftelse

OCR, der skelner mellem tegn i billeder af trykt eller manuelt skrevet indhold, for det meste med det endelige mål at kode indholdet i en organisation mere og give mulighed for at ændre eller bestille Department of Computer Science and Engineering, Michigan State University. Der skabes strategier til at opdage objekter, for at finde hvilke af deres højdepunkter, der genkender dem fra andre, og til at planlægge beregninger, som kan bruges af en maskine til at udføre karakteriseringen. Væsentlige applikationer omfatter ansigtsgenkendelse, fingeraftryk genkendeligt bevis, undersøgelse af optagelsesbilleder, udvikling af 3D artikelmodel, robotrute og repræsentation/undersøgelse af 3D volumetrisk information. Ebbe- og flodforskningsspørgsmål omfatter biometrisk bekræftelse, programmeret observation og følgning, håndløs HCI, ansigtsvisning, computeriseret vandmærkning og undersøgelse af design af online-arkiver. Afdøde alumner fra laboratoriet har beskæftiget sig med anerkendelse af skrivekunst, signaturkontrol, visuel læring og billedgendannelse."

Model:

Vi burde se, at det kræver et chokerende par pixel data at have muligheden for at genkende motivet på et billede, har en gruppe kørt af en MIT-specialist fundet. Afsløringen kunne foranledige ekstraordinære fremskridt i det mekaniserede genkendelige bevis på onlinebilleder og endelig give pc'er en forudsætning for at se, som folk gør. At udlede en særlig kort skildring ville være et væsentligt fremskridt i retning af at gøre det tænkeligt at inventarisere de milliarder af billeder på internettet som følge heraf. Lige nu afhænger de ensomme tilgange til at lede efter billeder af indholdsindskrifter, som enkeltpersoner har indtastet i hånden for hvert billede, og adskillige billeder har brug for sådanne data. Programmeret ID ville ligeledes give en tilgang til at arkivere billeder, som enkeltpersoner downloader fra edb-kameraer til deres pc'er, uden at opleve og undertekster hver enkelt i hånden. Endelig kunne det også fremkalde ægte maskinsyn, hvilket engang kunne tillade robotter at sortere informationen fra deres kameraer og sortere ud, hvor de er. Så hvis to billeder har en sammenlignelig gruppering [af tal], er de formodentlig komparative lavet af generelt en lignende artikel, generelt i et lignende arrangement." Hvis et billede har været relateret til en inskription eller titel, på det tidspunkt vil forskellige billeder, der koordinerer dets matematiske kode, sandsynligvis vise en lignende genstand (f.eks. et køretøj, et træ eller en person), og derfor kan navnet relateret til et billede være flyttet til de andre. "Med ekstremt mange billeder kan selv almindeligt ligefremme beregninger fungere rigtig godt" til at genkende billeder på denne måde.

⦁ Ansigtsgenkendelse

vi indser, at rammer for ansigtsgenkendelse hele tiden bliver berømte som metoder til at fjerne biometriske data. Ansigtsgenkendelse har en grundlæggende del i biometriske rammer og er tillokkende til forskellige applikationer, herunder visuel rekognoscering og sikkerhed. I lyset af den samlede befolknings anerkendelse af ansigtsbilleder i forskellige rapporter, har ansigtsgenkendelse et utroligt potentiale til at blive til den banebrydende biometriske innovation af beslutning.

Billedgenkendelsessystemer

⦁ Bevægelsesundersøgelse

Nogle få opgaver identificerer sig med bevægelsesvurdering, hvor en billedsekvens er forberedt for at skabe en måler for hastigheden enten ved hvert fokus på billedet eller i 3D-scenen eller endda for det kamera, der leverer billederne. Forekomster af sådanne opgaver er:

⦁ Egobevægelse

Beslutning om den ufleksible 3D-bevægelse (pivot og fortolkning) af kameraet ud fra en billedsekvens skabt af kameraet.

⦁ Sporing

Følgende vil følge udviklingen af ​​et (generelt) mere beskedent arrangement af interessefokus eller protester (f.eks. køretøjer eller personer) i billedets rækkefølge.

⦁ Optisk strøm

Dette er for at bestemme, for hvert punkt i billedet, hvordan dette punkt bevæger sig sammenlignet med billedplanet, dvs. dets tydelige bevægelse. Denne bevægelse er et resultat både af, hvordan det sammenlignende 3D-punkt bevæger sig i scenen, og hvordan kameraet bevæger sig sammenlignet med scenen.

⦁ Genoprettelse af scene

Givet et eller (normalt) flere billeder af en scene, eller en video, målrettes scenegengivelse, der registrerer en 3D-model af scenen. I det nemmeste tilfælde kan modellen være en masse 3D-fokus. Mere raffinerede strategier producerer en total 3D overflademodel

⦁ Billedgenopbygning

Pointen med at genopbygge billedet er evakueringen af ​​uro (sensorklammer, bevægelse obskure osv.) fra billeder. Den mindst komplekse tænkelige metode til udvisning af uroligheder er forskellige slags kanaler, for eksempel lavpaskanaler eller mellemkanaler. Mere moderne strategier forventer en model for, hvordan kvarterets billedstrukturer ligner, en model, der genkender dem fra tumulten. Ved først at undersøge billedinformationen i et stykke tid af de nærliggende billedstrukturer, f.eks. linjer eller kanter, og bagefter kontrollere adskillelsen afhængigt af nabodata fra undersøgelsestrinnet, bliver en overlegen grad af uro-evakuering generelt set i modsætning til den mindre komplekse metoder. En model på dette felt er deres maleri. Nogle få rammer er uafhængige applikationer, der adresserer et bestemt estimerings- eller anerkendelsesproblem, mens andre omfatter en underarrangement af en større plan, som f.eks. ligeledes indeholder underrammer til styring af mekaniske aktuatorer, indretning, databaser, informationsbaser, mandskab. maskingrænseflader og så videre. Den særlige udførelse af en pc-visionsramme afhænger ligeledes af, om dens anvendelighed er forudbestemt, eller hvis en del af den meget godt kan læres eller justeres under aktivitet. Der er, hvad end det kan være, almindelige kapaciteter, som findes i adskillige pc-visioner