Drucken

Beschreibung:

Das System Text to Speech, oder auch abgekürzt TTS, bezeichnet ein Verfahren der Sprachsynthese, mit dem man einen Fließtext in eine akustische Sprachausgabe umwandeln kann. Zum Einsatz kommt dieses Verfahren, um zum Beispiel blinden oder sehbehinderten Menschen Webseite-Inhalte oder Autofahrern den Inhalt einer eingehenden SMS vorzulesen. Die Sprachsignale können auf zwei unterschiedlichen Wegen erzeugt werden. Zur Verfügung steht hier die Signalmodellierung, bei der Sprachaufnahmen in Form von Samples zum Einsatz kommen. Die zweite Variante ist die physiologische Modellierung, die komplett vom Rechner erzeugt wird.

Eine große Herausforderung der Sprachsynthese war lange die Erzeugung eines möglichst natürlich klingenden Sprachflusses. Heute haben sich die Verfahren zur Spracherzeugung aber so weiterentwickelt, dass man diese nur noch schwer von der menschlichen Sprechweise unterscheiden kann.