Genom att surfa vidare godkänner du att vi använder cookies. Jag förstår

En smartare it-nyhetssajt

Google AI skiljer tal från brus

Forskare vid Google Research har utvecklat en audio-visuell AI-lösning som kan känna igen röster bara genom att iaktta människors ansikten när de talar. Det som annars brukar kallas cocktail party-effekten och varit en unik mänsklig förmåga kan därmed bli tillgänglig för utvecklingen av hörapparater och videomötesteknik.

Text anne hammarskjöld Foto adobestock 4 maj 2018 digit

tre-glada-pa-cocktailparty.jpg

– Människor är anmärkningsvärt bra på att fokusera sin uppmärksamhet på en viss person i en högljudd miljö och mentalt dämpa andra röster och ljud. Förmågan är medfödd hos människor men fortfarande en stor utmaning för datorer, skriver Inbar Mosseri och Oran Lang, programvaruingenjörer på Google Research i ett blogginlägg.

Kameralänkade hörapparater

Nu har de skapat Google AI, en audio-visuell modell som kan isolera talsignaler från en rad andra ljudinsignaler, som ytterligare röster och bakgrundsbrus. De bedömer att lösningen är intressant för en rad tillämpningar där många människor pratar, från talförbättring och -identifiering i videoklipp, till videokonferenser och mer avancerad hörapparater. I förlängningen skulle Google AI kunna användas i kameralänkade hörapparater som ökar ljudet av den som står framför användaren.

Google AI kan skapa rena ljudspår även i sammanhang där människor försöker konkurrera om uppmärksamheten eller delvis döljer ansiktet bakom sin hand eller en mikrofon.

För närvarande undersöker Google möjligheterna att använda tekniken i sina produkter.

Senaste nytt

5G mobilens räddning

16 augusti 2019

Försäljningen av smarta mobiler minskar med 2,5 procent under 2019. Det är först under 2020 som det kommer att ske en ökning, och det sker i samband med introduktionen av 5G. Det uppger analytikerfirman Gartner. 

Plattor mot hjärtsvikt

16 augusti 2019

Om patienter med hjärtsvikt får tillgång till sin information hemma, blir de tryggare och gör inte lika många sjukhusbesök. Det konstaterar Skånes universitetssjukhus i en ny undersökning.

Explosion för SD-WAN

15 augusti 2019

Marknaden för SD-WAN kommer att växa med 30 procent per år de kommande åren. 2023 lär marknaden vara värd över fem miljarder dollar. Detta enligt analytikerfirman IDC. 

Fejktunga testar whiskey

15 augusti 2019

Forskare i Glasgow har tagit fram en artificiell tunga som både kan åldersbestämma whiskey och även ha koll om den är förfalskad. Innovationen bygger på hur guld och aluminium förändrar sig i olika miljöer.

Ryssland vs Google

14 augusti 2019

Ryssland har ökat trycket på Google att censurera politiska och, vad de anser, illegala demonstrationer i landet. Landets medienämnd Roskomnadzor har hört av sig till Google och insisterat på att man måste sluta marknadsföra dessa olagliga event på Youtube.

Bättre än antibiotika

14 augusti 2019

En nyutvecklad antibakteriell gel framställd av bakteriedödande virus, bakteriofager-virus, öppnar för en rad viktiga tillämpningar inom medicin och miljöskydd. Gelen kan vara en lösning på det växande hotet från antibiotikaresistenta virus.