Talböcker görs med mänskliga röster eller talsyntes

MTM producerar talböcker både genom mänsklig inläsning och genom syntetiskt tal. Läs mer om hur arbetet med talböcker går till i texten som följer:

MTM använder talsyntes för att snabbt kunna producera studielitteratur och taltidningar. Vi har producerat studielitteratur med talsyntes sedan 2006 och i dagsläget gör vi fler än 1 000 svenska och engelska talböcker med talsyntes varje år. I tillägg använder vi talsyntes för att producera tal till över 120 svenska dagstidningar. 

MTM använder flera olika talsyntesröster för att producera talböcker och taltidningar. Under vintern 2023 börjar vi använda neurala talsyntesröster från Microsoft för att producera vissa talböcker. Denna typ av röster är det som brukar kallas AI-röster. MTM producerar också flera tusen titlar med mänsklig inläsning varje år. Du kan läsa mer om inläsningarna här: Produktion av talböcker (mtm.se)

Så går det till att skapa en talbok 

Inläsningen av talboken är en del av en längre process för att tillgängliggöra litteratur för MTM:s användare. Hur lång produktionstiden är beror på en mängd olika faktorer. När en beställning kommer in till MTM från universitets- eller högskolebiblioteket händer följande: 

Vi ordnar ett textunderlag 

MTM beställer ett textunderlag. Är boken utgiven i Sverige kan vi ofta få en digital fil från förlaget ganska snabbt, men är det en utländsk bok (som ofta med kurslitteratur) måste den beställas från förlaget eller nätbokhandel och sedan skannas. 

Uppmärkning och bildbeskrivningar 

Bokens text märks upp i EPUB 3-format. Det betyder att texten kodas med information om rubriker, brödtext, bildtext, fotnoter och så vidare. Det är nödvändigt för att man ska kunna navigera i boken i läsprogrammen, till exempel bläddra mellan kapitel, sidor och rubriker. Många använder både text och ljud när de läser, så texten märks upp så att den mening som läses upp får en färgmarkering samtidigt. Det gör det enklare att följa med i texten.  

Vi beskriver också eventuella bilder, tabeller och diagram i boken så att de blir tillgängliga för personer med synnedsättning eller blindhet. 

Arbetet med uppmärkning och bildbeskrivning är detsamma oavsett om boken läses in med mänsklig röst eller talsyntes och tar olika lång tid för olika böcker. Det är till exempel inte ovanligt att kurslitteratur är mycket omfattande och innehåller många bilder som ska få bildbeskrivningar. 

Talsättning 

Nu kan boken antingen skickas till en av våra upphandlade inläsningsleverantörer för inläsning med mänsklig röst eller produceras med talsyntes. Kurslitteratur innehåller ofta svår text med tabeller, ekvationer, bilder och olika språk. Det kan göra att de inte lämpar sig för produktion med talsyntes. Det görs en enskild bedömning för varje talbok. 

Med talsyntes 

I kurslitteratur finns ofta speciella termer och namn som kan vara svåra att uttala. När vi producerar talböcker med talsyntes analyserar vi därför först bokens text och lägger till uttal för speciella ord i ett lexikon som sedan används av talsyntesrösten för att uttala orden korrekt. Det tar sedan bara ungefär 15 minuter att talsätta boken.  

Med mänsklig röst 

Mänsklig inläsning av boken tar olika lång tid och beror på bokens storlek och svårighetsgrad. Inläsarna har olika specialistkompetenser inom olika ämnen, så vissa är till exempel godkända för att läsa in medicin, andra för juridik.  

Tipsa en vän om denna sida via epost.
(Obligatoriskt fält)
(Obligatoriskt fält)
(Obligatoriskt fält)
(Obligatoriskt fält)