Voices for Speech Synthesis

STEMMEN VOOR SPRAAKSYNTHESE

Arthur Dirksen / Fluency

NOTaS, 24 maart 2016, Zwijsen, Tilburg

FLUENCY• tekst-naar-spraaksoftware voor Nederlands en Fries

PRODUCTEN• Fluency TTS• Spika

DIFONEN• 50 X 50 = 2500

MBROLA DIFOONSYNTHESE (sinds 1998)• 1 exemplaar van elk difoon• uit monotoon ingesproken woord• manipulatie van duur en melodie

UNIT SELECTIE (sinds 2008)• gelabeld corpus van voorgelezen spraak• concatenatie van best passende difonen

http://www.notas.nl/audio/demo1.mp3


STEMMEN MAKEN

BASISCORPUS• 387 woorden + 387 zinnen• ong. 3 kwartier spraak• ong. 4 uur studiotijd

STEMMEN• Arthur, Fiona (16 jaar), Davíd (13 jaar), Marco, Miriam, Rob, Janneke• Dirk (Vlaams), Sanghita (Surinaams), Fluisterstem

NIEUWE STEM: ARNO• professionele spreker (Arno Lubbinge)• basiscorpus + langere teksten (o.a. literaire fragmenten, incl. dialogen)• ong. 3 uur spraak

EXPERIMENT: STEM VAN AUDIOBOEK• 56 hoofdstukken, ong. 11 uur spraak (Dedicon)• automatisch gelabeld (d.w.z. zonder correctie)




STEMMEN BELUISTEREN

Er staan 4 geluidsfragmenten klaar om te beluisteren.

1.http://www.notas.nl/audio/demo1.mp32.http://www.notas.nl/audio/demo2.mp33.http://www.notas.nl/audio/demo3.mp34.http://www.notas.nl/audio/demo4.mp3

Voices for Speech Synthesis

Education

Transcript of Voices for Speech Synthesis