Was ist TTS (Text-to-Speech)?

TTS, ein Akronym für Text-to-Speech, ist eine Sprachsynthesetechnologie, der geschriebene Text in gesprochene Wörter umwandelt. Dabei werden Wörter synthetisiert und nicht vorher aufgezeichnete Nachrichten wiedergegeben. Hierbei stellen sich jedoch auch Herausforderungen in der Sprachbedeutung, z. B. in der englischen Sprache, wo viele Wörter zwar gleich geschrieben werden, aber unterschiedliche Aussprachen und Bedeutungen haben. So muss TTS beispielsweise herausfinden, ob das Wort "lead" wie in "lead the way" oder wie in "lead pipe" ausgesprochen werden soll. Dies geschieht durch Berechnung der Wahrscheinlichkeit und Auswahl der wahrscheinlichsten Aussprache, wobei es jedoch u. U. zu Fehlaussagen kommen kann.

TTS wurde ursprünglich als Hilfstechnologie für Sehbehinderte entwickelt, um ihnen das Verständnis von z. B. Website-Inhalten zu erleichtern. Heute ist TTS eine gängige Funktion von Websites und beliebten Anwendungen wie Microsoft Word. Es gibt mehrere Anbieter von TTS-Software, und die TTS-Funktionalität kann oft über eine einfache API in Websites und Anwendungen integriert werden. TTS setzt sich immer mehr durch, da alltägliche Nutzer es für Aktivitäten wie das Vorlesen eingehender Textnachrichten nutzen.