Genom att surfa vidare godkänner du att vi använder cookies. Jag förstår

En smartare it-nyhetssajt

Google AI skiljer tal från brus

Forskare vid Google Research har utvecklat en audio-visuell AI-lösning som kan känna igen röster bara genom att iaktta människors ansikten när de talar. Det som annars brukar kallas cocktail party-effekten och varit en unik mänsklig förmåga kan därmed bli tillgänglig för utvecklingen av hörapparater och videomötesteknik.

Text anne hammarskjöld Foto adobestock 4 maj 2018 digit

tre-glada-pa-cocktailparty.jpg

– Människor är anmärkningsvärt bra på att fokusera sin uppmärksamhet på en viss person i en högljudd miljö och mentalt dämpa andra röster och ljud. Förmågan är medfödd hos människor men fortfarande en stor utmaning för datorer, skriver Inbar Mosseri och Oran Lang, programvaruingenjörer på Google Research i ett blogginlägg.

Kameralänkade hörapparater

Nu har de skapat Google AI, en audio-visuell modell som kan isolera talsignaler från en rad andra ljudinsignaler, som ytterligare röster och bakgrundsbrus. De bedömer att lösningen är intressant för en rad tillämpningar där många människor pratar, från talförbättring och -identifiering i videoklipp, till videokonferenser och mer avancerad hörapparater. I förlängningen skulle Google AI kunna användas i kameralänkade hörapparater som ökar ljudet av den som står framför användaren.

Google AI kan skapa rena ljudspår även i sammanhang där människor försöker konkurrera om uppmärksamheten eller delvis döljer ansiktet bakom sin hand eller en mikrofon.

För närvarande undersöker Google möjligheterna att använda tekniken i sina produkter.

Senaste nytt

Nätfiske med paket

15 januari 2021

Microsoft och DHL är de varumärken som används mest vid phishingförsök. De mest utnyttjade branscherna är teknik, följt av logistik och detaljhandel. 

Kommuner ikapp 2035

14 januari 2021

Behovet av digital kompetens har fördubblats de senaste 15 åren inom offentlig sektor. Först 2035 spås myndigheter, regioner och kommuner att vara ikapp den privata sektorn.

Lämnar VMware för Intel

14 januari 2021

Pat Gelsinger ersätter Bob Swan och blir ny vd på Intel. Pat Gelsinger kommer närmast från rollen som vd för VMware men har en lång historia med Intel, där han började jobba som tonåring.

Hundens nya vän

14 januari 2021

En uppkopplad dörr låter din hund springa in och ut ur huset som den vill, utan att du behöver vara hemma. 

Svensk sand i 3D

13 januari 2021

Idag används sand från Tyskland i 3D-skrivare, trots att svensk sand skulle innebära en bättre kvalitet till en lägre kostnad och ökad hållbarhet. Det konstaterar ett forskningsprojekt vid Rise.

Toan kollar din hälsa

13 januari 2021

Det japanska företaget Toto har tagit fram en Wellness Toilet som kontrollerar användarens avföring och analyserar personens hälsa, varje gång toaletten används.