Genom att surfa vidare godkänner du att vi använder cookies. Jag förstår

En smartare it-nyhetssajt

Google AI skiljer tal från brus

Forskare vid Google Research har utvecklat en audio-visuell AI-lösning som kan känna igen röster bara genom att iaktta människors ansikten när de talar. Det som annars brukar kallas cocktail party-effekten och varit en unik mänsklig förmåga kan därmed bli tillgänglig för utvecklingen av hörapparater och videomötesteknik.

Text anne hammarskjöld Foto adobestock 4 maj 2018 digit

tre-glada-pa-cocktailparty.jpg

– Människor är anmärkningsvärt bra på att fokusera sin uppmärksamhet på en viss person i en högljudd miljö och mentalt dämpa andra röster och ljud. Förmågan är medfödd hos människor men fortfarande en stor utmaning för datorer, skriver Inbar Mosseri och Oran Lang, programvaruingenjörer på Google Research i ett blogginlägg.

Kameralänkade hörapparater

Nu har de skapat Google AI, en audio-visuell modell som kan isolera talsignaler från en rad andra ljudinsignaler, som ytterligare röster och bakgrundsbrus. De bedömer att lösningen är intressant för en rad tillämpningar där många människor pratar, från talförbättring och -identifiering i videoklipp, till videokonferenser och mer avancerad hörapparater. I förlängningen skulle Google AI kunna användas i kameralänkade hörapparater som ökar ljudet av den som står framför användaren.

Google AI kan skapa rena ljudspår även i sammanhang där människor försöker konkurrera om uppmärksamheten eller delvis döljer ansiktet bakom sin hand eller en mikrofon.

För närvarande undersöker Google möjligheterna att använda tekniken i sina produkter.

Senaste nytt

Mer batteritid

7 juli 2020

En ny uppdatering av webbläsaren Google Chrome kan spara timmar av batteritid. Funktionen stänger bland annat av Javascript på flikar som för tillfället inte visas för användaren.

75 milj ton avfall

6 juli 2020

Världens befolkning kommer att kasta närmare 75 miljoner ton elektroniskt avfall 2030, vilket är 20 miljoner ton mer än vi kastade förra året. Det visar en ny forskningsrapport.

Äkta mat med blockkedja

3 juli 2020

Mat till ett värde av 300 miljarder dollar kan spåras med hjälp av blockkedja och IoT, vilket skulle innebära att livsmedelsindustrin kan spara drygt 100 miljarder dollar om året. Det visar en ny rapport.

KTH mot alzheimer

3 juli 2020

Med hjälp av molekylär AI och machine learning kan mysterierna kring alzheimer och andra hjärnsjukdomar komma närmare en lösning. Metoden ska ge en bättre bild av hjärnan än vad mikroskop ger. Det menar forskare på KTH och Karolinska Institutet.

Fejkappar på Google

2 juli 2020

Google har tagit bort 25 appar med skadlig kod som kapade inloggningsuppgifter till bland annat Facebook. Apparna har över 2,3 miljoner nedladdningar.

Coop kör obemannat

2 juli 2020

Coop testar en egenutvecklad ny tjänst för självscanning och betalning med mobilen. I höst kommer matkedjan även öppna sina första obemannade butiker.