MTM:s expert om talsyntes och AI-röster
Christina Tånnander, talsyntesexpert vid MTM, berättar om talsyntesröster och hur fler AI-röster kan förbättra läsupplevelsen.
Forskning och utvärdering
Inom forskningen arbetar man mycket med att hitta ännu bättre metoder, eller algoritmer, för att skapa bättre talsyntesröster.
Men vad är egentligen en bra röst? Det beror till stor del på vad den ska användas till. En digital assistent kanske ska låta käck och glad, en röst som läser upp tidning ska vara saklig och en röst som läser upp skönlitteratur behöver kunna tolka texten och använda rätt känsla i uppläsningen.
Detta forskar man också om, och den forskning som MTM särskilt intresserar sig för gäller uppläsning av långa och informationsrika texter. Även olika metoder för att utvärdera talsyntes är viktiga – hur mäter man att en röst förmedlar texten på ett bra sätt?
Vad händer nu?
Idag finns många neurala talsyntesröster, eller ”AI-röster”, på marknaden, också flera svenska röster. Med bättre röster följer fler användningsområden och en högre acceptans för talsyntes. Talsyntes börjar nu smyga sig in på områden som tidigare inte varit aktuella, till exempel uppläsning av skönlitteratur.
Även tekniken för att tolka svårare text som facklitteratur går framåt och områdena för talsyntes kommer att bli fler även här. Men för att böckerna ska vara tillgängliga behöver också texten vara tillgänglighetsanpassad genom att man använder standardformat för att märka upp till exempel rubriker och sidnummer så att det går att navigera i boken.
Ju fler som producerar digital text som är tillgänglighetsanpassad på detta sätt, och ju bättre talsyntesrösterna är, desto fler böcker blir tillgängliga för personer som behöver få texten uppläst.
Det ska bli spännande att följa talsyntesens framfart framöver. Hur kommer acceptansen för syntetiskt tal att öka? Vilka nya användningsområden kommer att fungera bra och vilka kommer att fungera sämre? När kan användaren själv välja exakt hur rösten ska låta? Och när kan vi inte längre skilja mellan mänskligt och syntetiskt tal?
Talsyntes på MTM
På MTM har vi köpt in nya moderna röster och kommer att börja använda dem runt årsskiftet 2023/2024. Vi fortsätter att använda dem främst för enklare högskolelitteratur, men kommer också att titta på om vi kan göra fler böcker med talsyntes framöver.
I första hand gäller detta facklitteratur, men det kan också bli aktuellt att producera viss skönlitteratur med talsyntes, så att läsarna får tillgång till nya böcker snabbare, under tiden som boken blir inläst av en mänsklig röst.