Genom att surfa vidare godkänner du att vi använder cookies. Jag förstår

En smartare it-nyhetssajt

Google AI skiljer tal från brus

Forskare vid Google Research har utvecklat en audio-visuell AI-lösning som kan känna igen röster bara genom att iaktta människors ansikten när de talar. Det som annars brukar kallas cocktail party-effekten och varit en unik mänsklig förmåga kan därmed bli tillgänglig för utvecklingen av hörapparater och videomötesteknik.

Text anne hammarskjöld Foto adobestock 4 maj 2018 digit

tre-glada-pa-cocktailparty.jpg

– Människor är anmärkningsvärt bra på att fokusera sin uppmärksamhet på en viss person i en högljudd miljö och mentalt dämpa andra röster och ljud. Förmågan är medfödd hos människor men fortfarande en stor utmaning för datorer, skriver Inbar Mosseri och Oran Lang, programvaruingenjörer på Google Research i ett blogginlägg.

Kameralänkade hörapparater

Nu har de skapat Google AI, en audio-visuell modell som kan isolera talsignaler från en rad andra ljudinsignaler, som ytterligare röster och bakgrundsbrus. De bedömer att lösningen är intressant för en rad tillämpningar där många människor pratar, från talförbättring och -identifiering i videoklipp, till videokonferenser och mer avancerad hörapparater. I förlängningen skulle Google AI kunna användas i kameralänkade hörapparater som ökar ljudet av den som står framför användaren.

Google AI kan skapa rena ljudspår även i sammanhang där människor försöker konkurrera om uppmärksamheten eller delvis döljer ansiktet bakom sin hand eller en mikrofon.

För närvarande undersöker Google möjligheterna att använda tekniken i sina produkter.

Senaste nytt

Guldlänken för öppen data

14 juni 2019

Projektet ÖdiS uppmärksammas med Guldlänken 2019 för sitt arbete med ökad användning av öppen data för för innovation och verksamhetsutveckling i den offentliga sektorn. ÖdiS är ett gemensamt projekt mellan alla 26 Stockholmskommuner.

Sensor för bättre luft

14 juni 2019

På Chalmers har man utvecklat små sensorer som kan monteras på lyktstolpar och därifrån mäta luftkvaliteten. Tidigare har man oftast mätt luftens kaliber av större och dyrare mätstationer.

Drönare som hot

13 juni 2019

Att drönare numera finns i var och var annans ägo skapar säkerhetsrisker som vi måste börja fundera över, detta menar forskningsföretaget IOActive. 

AI för rena hav

13 juni 2019

Fujitsus AI-baserade tjänst VFO ska optimera bränsleförbrukningen till havs. Lösningen ska leda till minskade kostnader och mindre miljöpåverkan. 

Brister i blockkedjan

12 juni 2019

Marknaden för blockkedjor ökar kraftigt men det finns lite smolk i kedjebägaren. Hela 90 procent av dagens blockkedjeplattformar kommer att behöva bytas ut de kommande åren. Det visar en rapport från Gartner.

Nu granskas Spotify

12 juni 2019

Datainspektionen ska se över hur Spotify behandlar rätten till registerutdrag. Granskningen ska ske då myndigheten blivit varse om att brister kan finnas i detta arbete.