Friare robot med 3D

Nu kan 3D-modeller skapas från videor tagna med enkla kroppskameror. Detta genombrott inom datorseende och robotars orienteringsförmåga öppnar nya möjligheter för bland annat polis och räddningstjänst. Det visar en doktorsavhandling från Linköpings universitet

5 september 2018Uppdaterad 2 oktober 2023Reporter anne hammarskjölddigitFoto adobestock

Att robotar och andra system kan orientera sig och upptäcka föremål och människor är avgörande för utvecklingen av autonoma system och AI. Hannes Ovréns doktorsavhandling handlar om hur det är möjligt att utifrån videofilmer tagna av billiga kroppskameror skapa en skalenlig och mätbar 3D-modell av omgivningen och bidrar till den utvecklingen.

Läs mer

Robotar rökta utan karta

Idag rör sig robotar ganska försiktigt för att orientera sig och kan till och med behöva stanna för att lokalisera sig. Med den här tekniken kan roboten röra sig mera fritt och bygga en modell av sin omgivning medan den rör sig.

Återskapa brottsplatser

Andra användningsområden är exempelvis inom polisen eller räddningstjänsten där de med en kamera på kroppen kan återskapa brotts- eller skadeplatsen i 3D i efterhand, med människor och föremål på exakt den plats de befann sig i fotoögonblicket.

Läs mer

Myrsteg för robotar

Utmaningen med att skapa 3D-modeller från enkla videokameror har hittills varit att kameran behöver stå stilla, helst på ett stativ. När kameran rör sig ser det på bilderna ut som raka föremål är böjda och står på olika höjd, de vobblar omkring och bilden blir distorderad. Orsaken till detta är att enkla kameror har en så kallad rullande slutare där bilden byggs upp pixelrad för pixelrad som kamerorna i de smarta mobilerna.

– Det finns en rörelse i varje bildruta, men man kan göra bilden betydligt bättre genom att modellera hur kameran har rört sig och kompensera för det, säger Hannes Ovrén, doktorand vid avdelningen för datorseende på Linköpings universitet.

Enklare med mjukare kurva

För att beräkningarna inte ska bli alltför omfattande skapar han en kurva för hur kameran har rört sig, en så kallad spline. Kurvan byggs upp av knutpunkter där varje knutpunkt styr kurvans utseende vid en viss tidpunkt i filmen. Ju tätare knutpunkterna placeras desto mer komplicerade rörelser kan kurvan hantera – men beräkningarna blir också allt mer omfattande.

I avhandlingen visar Hannes Ovrén att det går att använda betydligt färre knutpunkter om man samtidigt modellerar det fel som uppstår på grund av att kurvan då rätas ut och blir mjukare. För att felet inte ska bli så stort använder han också en tröghetssensor som sätts fast på kameran, en liten och billig sensor som håller reda på accelerationen, vinkelhastigheten och riktningen mot jordplanet.

Förenklingen innebär att kameran inte har rört sig exakt utmed kurvan men genom att även ta reda på hur skillnaden i rörelse påverkar storleken på mätfelet kan han vara ännu mera säker på att 3D-modellen och avstånden i den är rättvisande.

Hannes Ovrén har genomför sitt doktorandarbete inom projektet Inlärningsbara rörelsemodeller för kameror som finansieras av Vetenskapsrådet.

Läs mer om ämnet: