Genom att surfa vidare godkänner du att vi använder cookies. Jag förstår

En smartare it-nyhetssajt

Google AI skiljer tal från brus

Forskare vid Google Research har utvecklat en audio-visuell AI-lösning som kan känna igen röster bara genom att iaktta människors ansikten när de talar. Det som annars brukar kallas cocktail party-effekten och varit en unik mänsklig förmåga kan därmed bli tillgänglig för utvecklingen av hörapparater och videomötesteknik.

Text anne hammarskjöld Foto adobestock 4 maj 2018 digit

tre-glada-pa-cocktailparty.jpg

– Människor är anmärkningsvärt bra på att fokusera sin uppmärksamhet på en viss person i en högljudd miljö och mentalt dämpa andra röster och ljud. Förmågan är medfödd hos människor men fortfarande en stor utmaning för datorer, skriver Inbar Mosseri och Oran Lang, programvaruingenjörer på Google Research i ett blogginlägg.

Kameralänkade hörapparater

Nu har de skapat Google AI, en audio-visuell modell som kan isolera talsignaler från en rad andra ljudinsignaler, som ytterligare röster och bakgrundsbrus. De bedömer att lösningen är intressant för en rad tillämpningar där många människor pratar, från talförbättring och -identifiering i videoklipp, till videokonferenser och mer avancerad hörapparater. I förlängningen skulle Google AI kunna användas i kameralänkade hörapparater som ökar ljudet av den som står framför användaren.

Google AI kan skapa rena ljudspår även i sammanhang där människor försöker konkurrera om uppmärksamheten eller delvis döljer ansiktet bakom sin hand eller en mikrofon.

För närvarande undersöker Google möjligheterna att använda tekniken i sina produkter.

Senaste nytt

Nya regler för telekom

14 december 2018

När Peter Eriksson träffade de andra EU-ländernas digitaliseringsministrar i Bryssel den 4 december diskuterade de ett finansieringsprogram för den digitala omvandlingen i Europa. Andra frågor på dagordningen var ett europeiskt kompetenscentrum för cybersäkerhet och uppdaterade regler för e-privacy.

AR av rätta virket

14 december 2018

Med samma teknik som används i Pokémon Go kan skogsägare nu mäta träd. Arboreal Trädhöjd gör det möjligt att samla och bearbeta data för bättre skogsförvaltning och mer exakta kundleveranser. 

Bottarnas val

13 december 2018

Inför valet fick Sverigedemokraterna starkt stöd på Twitter. Nu har FOI, Totalförsvarets forskningsinstitut, på uppdrag av MSB analyserat såväl diskussionerna om valets genomförande som hur SD:s genomslag har påverkats av bottar.

Täckning under klubban

12 december 2018

Mer frekvenser till mobilt bredband i hela landet och upp till 300 miljoner kronor till utbyggnad av ny täckning i glesbygd. Det är mycket som avgörs när PTS startar auktionen för att dela ut tillstånd att använda radiosändare i 700 MHz-bandet. 

Alibaba förbi Google

12 december 2018

Alibabas röstassistent klarar av att hantera avbrott, förstå ett ostrukturerat samtal och kan läsa mellan raderna. Det innebär att Alibabas röstassistent nu anses som mer sofistikerad än Googles Duplex. 

Lösning för läsning

11 december 2018

Att lära sig läsa och skriva är bland de viktigaste färdigheter som skolan ska förmedla till barn och unga. Tyvärr ser verkligheten väldigt annorlunda ut men det finns digitala hjälpmedel som rätt använda kan bidra till mer inkluderande och individanpassad undervisning.