Artikel från KTH – Kungliga Tekniska högskolan

Den här artikeln bygger på ett pressmeddelande. Läs om hur redaktionen jobbar.

26 november 2014

Din röst ska bli ett designverktyg

Penna och papper är inte till mycket hjälp när man ska utforma nya ljud. Rösten är däremot ett förnämligt redskap.Det har forskare vid KTH insett. Ett europeiskt projekt där KTH ingår ska mynna ut i ett datoriserat designverktyg som ska hjälpa till med ljudskapandet. Resten tar din röst ta hand om.

Sten Ternström, professor i musikakustik vid KTH, är en av forskarna som är involverade i SkAT-VG (Sketching Audio Technologies using Voice and Gestures). Forskningsprojektet går ut på att försöka göra det möjligt att skissa med röster så väl som med gester när man jobbar med ljuddesign. Anledningarna är flera. Dels saknas ett bra skissverktyg, dels blir det som vi hör runt omkring oss allt mer angeläget.

– Det här sättet att jobba är en ganska djärv tanke kan tyckas, men samtidigt blir ljud allt viktigare i vår vardag. Vi har väldigt många apparater och system runt omkring oss numera, och ljud är relevanta för att vi ska kunna orientera oss. Det är också viktigt att förstå vad ljudet betyder utan att behöva läsa instruktionsboken, säger Sten Ternström.

Han ger flera exempel. En svensk lastbilstillverkare testar inbyggda cykelvarnare. Det bästa sättet att uppmärksamma en lastbilschaufför på att det finns en cyklist i närheten av lastbilen som chauffören inte kan se på grund av döda vinklar är nämligen att en cykelringklocka ljuder i lastbilen. En cykelvarnare med en annan ljudsignal hade inte varit lika effektiv, enligt Sten Ternström.

Ett annat är exempel är bilar. De säljs på känsla och olika detaljer som en dörr som stängs kan ju förmedla styrka eller finkänslighet. Även motorljudet är av yttersta vikt. Ett kommande EU-direktiv för hur motorfordon bör låta ska tas fram. För första gången överväger politiker att föreskriva en lägsta ljudnivå för bilar, inte bara högsta, och då med elektriska och hybridfordon i åtanke. Detta så att de inte blir för tysta. Detta främst för fotgängarnas säkerhet, men också för hur föraren upplever fordonets funktion.

– Tysta elektriska fordon kan vara ett problem. Det blev jag själv varse när jag var i Beijing i Kina för ett litet tag sedan. Där är nästan alla mopeder elektriska, och det var inte bara en gång som en sådan ljudlöst swischade förbi mig på två decimeters avstånd, berättar Sten Ternström.

Hur ska då forskarna gå till väga? Ja, som tidigare sagts så är penna och papper inte så användbart när man skissar på ljud. Vi människor är dock fenomenala på att härma ljud.

– Sedan födseln är vi hårdkodade på att imitera ljud. Det har att göra med att vi som barn ska lära oss att tala. Vi kan härmas och träffa ganska rätt redan på första försöket. Det är det som skiljer oss från andra däggdjur. Till exempel chimpanser och andra apor har ju samma fysiska förutsättningar när det kommer till mun och svalg som vi människor, men med den skillnaden att vi har mer hjärna dedikerad till uppgiften än vad de har. Den här medfödda förmågan hos människan har vi tänkt utnyttja för att skissa ljud, säger Sten Ternström..<br />Han nämner samtidigt människors förmåga att kunna beatboxa som ett utmärkt exempel på att rösten är mångsidig.

Med röstens ljud som ett nytt styrmedel ska forskarna tillsammans bygga ett tekniskt system – ett skissverktyg – som kan lyssna på mänskliga imitationer och komma med förslag på ljudvarianter. Med några enkla knapptryckningar och genom att vrida på rattar ska ytterligare förslag kunna genereras.

– I det här forskningsprojektet har vi på KTH fått uppgiften att studera hur folk gör för att härma ljud. Om jag vill låta som en motor, använder jag då stämband. läpparna, fickband eller tungspetsen? Eller kanske samtliga delar på en gång? Vi spelar helt enkelt in människor som imiterar med hjälp av kamera, mikrofon och elektroglottograf. Det är sedan den kunskapen vi ska använda oss av när vi skapa skissverktyget, säger Sten Ternström.

Han tillägger att elektroglottografens funktion är att visa när stämbanden går ihop.

Blir forskningsprojektet lyckat så skapas samhällsnytta genom förbättrad hälsa, säkerhet och livskvalitet.

Forskningsprojektet SkAT-VG har fyra partners: KTH, institutet IRCAM i Paris, det franska företaget Genesis och Venedigs universitet IUAV med professor Davide Rocchesso som koordinator arbetet.

KTH:s del i projektet är att samla in tusentals yttranden och härmade ljud, beskriva dem fonetiskt och klassificera dem i termer av de fysiska fenomen som imiteras. lassificeringen ska först vara manuell för att senare bli automatisk. Forskarna på KTH är Pétur Helgason (även fonetiker på Uppsala Universitet), Glaucía Laís Salomao, Anders Friberg och Tony Lindeberg, alla vid CSC-skolan.

Nyhetsbrev med aktuell forskning

Visste du att robotar som ser en i ögonen är lättare att snacka med? Missa ingen ny forskning, prenumerera på vårt nyhetsbrev!

Jag vill prenumerera