Genom att surfa vidare godkänner du att vi använder cookies. Jag förstår

En smartare it-nyhetssajt

Google AI skiljer tal från brus

Forskare vid Google Research har utvecklat en audio-visuell AI-lösning som kan känna igen röster bara genom att iaktta människors ansikten när de talar. Det som annars brukar kallas cocktail party-effekten och varit en unik mänsklig förmåga kan därmed bli tillgänglig för utvecklingen av hörapparater och videomötesteknik.

Text anne hammarskjöld Foto adobestock 4 maj 2018 digit

tre-glada-pa-cocktailparty.jpg

– Människor är anmärkningsvärt bra på att fokusera sin uppmärksamhet på en viss person i en högljudd miljö och mentalt dämpa andra röster och ljud. Förmågan är medfödd hos människor men fortfarande en stor utmaning för datorer, skriver Inbar Mosseri och Oran Lang, programvaruingenjörer på Google Research i ett blogginlägg.

Kameralänkade hörapparater

Nu har de skapat Google AI, en audio-visuell modell som kan isolera talsignaler från en rad andra ljudinsignaler, som ytterligare röster och bakgrundsbrus. De bedömer att lösningen är intressant för en rad tillämpningar där många människor pratar, från talförbättring och -identifiering i videoklipp, till videokonferenser och mer avancerad hörapparater. I förlängningen skulle Google AI kunna användas i kameralänkade hörapparater som ökar ljudet av den som står framför användaren.

Google AI kan skapa rena ljudspår även i sammanhang där människor försöker konkurrera om uppmärksamheten eller delvis döljer ansiktet bakom sin hand eller en mikrofon.

För närvarande undersöker Google möjligheterna att använda tekniken i sina produkter.

Senaste nytt

Beslut om blockkedja

6 december 2019

Lantmäteriet och DIGG har fått i uppdrag av regeringen att prova ny teknik för automatisering i offentlig förvaltning. När uppdraget är slut ska materialet samlas in för att kunna användas vidare. 

3D-printat på Ikea

6 december 2019

Det finns mycket att vinna med 3D-printade metalldelar till industrins tillverkningsmaskiner. För Ikea ökar kvaliteten i tillverkningen med 20 procent, samtidigt som förbrukningen av kylvatten minskade med 86 procent. Det visar forskning vid Örebro universitet.

O365 tolkar svenska

5 december 2019

Microsofts nya tjänst i O365 gör det möjligt att transkribera tal till text i realtid. Den välkomna nyheten kan bland annat underlätta möten i skolan mellan lärare och föräldrar med annat hemspråk. Tjänsten kommer att finnas i Microsoft Word, PowerPoint, OneNote och Outlook.

Garanterar digital vård

4 december 2019

Stockholm är Sveriges första region som inför en Digital vårdgaranti, vilket garanterar att alla dess medborgare även ska kunna söka vård digitalt. 

AR och VR exploderar

4 december 2019

Marknaden för augmented och virtual reality kommer 2020 att värderas till 18,8 miljarder dollar. Det är en ökning gentemot 2019 med 78 procent. 

Lågpris ökar

3 december 2019

Marknadsandelarna på mobilmarknaden fortsätter att öka för Huawei, Samsung och Oppo. Motsatt utveckling går att se för Apple och Xiaomi.