Sono stati definiti alcuni linguaggi di markup per la resa del parlato utilizzando un formato di descrizione di tipo XML. Il più recente è l'SSML (Speech Synthesis Markup Language) che dal 2004 è una raccomandazione del W3C, arrivato alla versione 1.1 nel 2010 e integrato nel 2008 dal linguaggio PLS (Pronunciation Lexicon Specification) usato per specificare in modo formale le regole di pronuncia. Tra i linguaggi di markup più vecchi rientrano tra gli altri JSML (Java Speech Markup Language) e SABLE: nonostante fossero stati entrambi proposti come base per uno standard, nessuno di essi ha avuto in realtà un'ampia diffusione.
I linguaggi di markup per la sintesi vocale non vanno confusi con i linguaggi di markup per i dialoghi: per esempio, VoiceXML oltre al markup per la conversione vocale prevede anche dei tag relativi al riconoscimento vocale, alla gestione dei dialoghi e alla composizione di numeri telefonici su comando vocale.
Alcuni laureandi approfondiscono l'argomento:
Tecnologie avanzate per la sintesi vocale dagli "Screen readers" alla "VoiceXML" Tesi
Interprete VXML (Capitolo 5) Tesi
Nessun commento:
Posta un commento