OWD2011 - Silent Speech - Educatieve Content Keten 2 - HP Kohler
Voices for Speech Synthesis
Transcript of Voices for Speech Synthesis
STEMMEN VOOR SPRAAKSYNTHESE
Arthur Dirksen / Fluency
NOTaS, 24 maart 2016, Zwijsen, Tilburg
FLUENCY• tekst-naar-spraaksoftware voor Nederlands en Fries
PRODUCTEN• Fluency TTS• Spika
DIFONEN• 50 X 50 = 2500
MBROLA DIFOONSYNTHESE (sinds 1998)• 1 exemplaar van elk difoon• uit monotoon ingesproken woord• manipulatie van duur en melodie
UNIT SELECTIE (sinds 2008)• gelabeld corpus van voorgelezen spraak• concatenatie van best passende difonen
STEMMEN MAKEN
BASISCORPUS• 387 woorden + 387 zinnen• ong. 3 kwartier spraak• ong. 4 uur studiotijd
STEMMEN• Arthur, Fiona (16 jaar), Davíd (13 jaar), Marco, Miriam, Rob, Janneke• Dirk (Vlaams), Sanghita (Surinaams), Fluisterstem
NIEUWE STEM: ARNO• professionele spreker (Arno Lubbinge)• basiscorpus + langere teksten (o.a. literaire fragmenten, incl. dialogen)• ong. 3 uur spraak
EXPERIMENT: STEM VAN AUDIOBOEK• 56 hoofdstukken, ong. 11 uur spraak (Dedicon)• automatisch gelabeld (d.w.z. zonder correctie)
STEMMEN BELUISTEREN
Er staan 4 geluidsfragmenten klaar om te beluisteren.
1.http://www.notas.nl/audio/demo1.mp32.http://www.notas.nl/audio/demo2.mp33.http://www.notas.nl/audio/demo3.mp34.http://www.notas.nl/audio/demo4.mp3