Toppen! Nu Àr du prenumerant pÄ Warp News
HÀrligt! Genomför ditt köp i kassan för full tillgÄng till Warp News
Varmt vÀlkommen tillbaka! Du Àr nu inloggad.
Tack! Kolla din inkorg för att aktivera ditt konto.
Klart! Din faktureringsinformation Àr nu uppdaterad.
Uppdateringen av faktureringsinformationen misslyckades.
🎞 AI kan automatiskt beskriva bilder för blinda och synskadade

🎞 AI kan automatiskt beskriva bilder för blinda och synskadade

En ny teknik gör att AI kan beskriva bilder bÀttre Àn vad en mÀnniska kan, vilket kan vara till stor hjÀlp för synskadade som anvÀnder datorer och mobiler.

Kent Olofsson
Kent Olofsson

Dela artikeln

Det finns mycket bilder pÄ webben och det kan vara ett problem för blinda och synskadade. De kan fÄ texten upplÀst av en digital röst, men information i bilder gÄr de ofta miste om. Det gÄr att lÀgga in text som beskriver bilden och som dÄ lÀses upp, men den texten mÄste lÀggas in manuellt och det Àr det mÄnga som glömmer.

Men nu kan Microsoft ha en lösning pÄ problemet. Företaget har nÀmligen utvecklat en AI-lösning som Àr lika bra som, eller rent av bÀttre Àn, mÀnniskor pÄ att beskriva bilder. Microsoft har redan en sÄdan lösning, men den nya varianten ska vara dubbelt sÄ bra.

Vivo, som lösningen heter, finns redan i Microsofts Seeing AI som Àr en app för att hjÀlpa blinda och synskadade att fÄ information frÄn bilder. Men för att ge tekniken mer spridning finns den ocksÄ som en del av Azure Cognitive Services. Det gör att utvecklare som anvÀnder Microsofts Azure kan integrera tekniken i sina egna lösningar.

Enkelt uttryckt fungerar Vivo sĂ„ att AI:n fĂ„r se bilder med nyckelord. Varje nyckelord Ă€r kopplat till ett visst objekt i bilden. Det fungerar ungefĂ€r som nĂ€r ett litet barn ska lĂ€ra sig lĂ€sa. En bild av ett Ă€pple visas ovanför texten â€Ă€pple” till exempel.

NÀr Vivo lÀrt sig koppla rÀtt objekt till rÀtt text Àr det dags för nÀsta steg fÄr AI:n lÀra sig att skriva kompletta meningar som innehÄller nyckelorden.

HÀr skiljer sig Vivo frÄn andra metoder som normalt anvÀnder sig av kompletta bildtexter för trÀningen. Nackdelen med det menar Microsofts forskare Àr att det bli svÄrt för AI:n att lÀra sig hur olika objekt hör ihop, vilket Vivo klarar av utan problem.

BÀttre Àn mÀnniskor pÄ bildtexter

Den hÀr metoden fungerar sÄ bra att Vivos beskrivningar var bÀttre Àn de som skrevs av mÀnniskor enligt en undersökning som forskarlaget gjorde.

Microsoft-forskarna hoppas nu att mÄnga andra företag ocksÄ ska anvÀnda Vivo för att underlÀtta för blinda och synskadade att anvÀnda datorsystem. Men Àven vi andra kan ha nytta av lösningen menar forskarna.

– Att förfina tekniker för att beskriva bilder kan hjĂ€lpa alla anvĂ€ndare. Det gör det enklare att hitta bilder via sökmotorer och för synskadade blir det en dramatisk förbĂ€ttring nĂ€r de ska anvĂ€nda webben och datorprogram, sĂ€ger Eric Boyd pĂ„ Azure AI.

En mer teknisk beskrivning av hur Vivo fungerar hittar du hÀr och studien om hur vÀl tekniken fungerar finns hÀr.


FĂ„ ett gratis veckobrev med
faktabaserade optimistiska nyheter


Genom att prenumerera bekrÀftar jag att jag har lÀst och godkÀnner personuppgifter och cookies policy.