13
Nov 2013
News written by pixel Add comments

Neulich war ich auf der Suche nach einer guten TTS Engine, um unter Windows7 meine Tutorials zu vertonen. Dazu gibt es auch ein Tutorial von mir (Siehe hier). Bei der Suche ist mir aufgefallen, dass es auch einige Online-Engines gibt. Eine der natürlichsten Sprachausgaben hat meiner Meinung Ivona. Auf dieser Seite findet man noch mehr deutsche Engines. In der Tabelle kann man sogar vor-hören wie gut sie einen Standard-Text in Sprache synthetisieren können.

Es war mir zuvor nicht bekannt, aber manche dieser Anbieter bieten tatsächlich auch eine API für Entwickler an. Diese möchte ich hier vormerken, da ich sicherlich noch eine sprechende App basteln werde.

Google TTS Engine

Einigen ist vielleicht aufgefallen, dass der Übersetzer von Google ein kleines Lautsprecher-Symbol rechts unten in der Textbox hat. Klickt man auf dieses Symbol, so wird der Text vorgelesen. Google bietet zwar keine offizielle API an, aber es existiert eine. Das merkt man, sobald der Queltext der Seite etwas genauer in Augenschein genommen wird. Interessant ist diese URL:

http://translate.google.com/translate_tts?tl=de&q=”Text To Speech”

Mit dem Parameter “tl” kann man konfigurieren, in welcher Sprache der Text vorgelesen werden soll. Für einen deutschen Text sollte man natürlich die deutsche Stimme wählen, also “tl=de”. Die deutsche Stimme klingt zugegeben nicht ganz Jugendfrei, ein wenig nach  Marilyn Monroe bei längeren Texten, ist aber immer noch besser wie eine Roboterstimme. Mit dem Parameter “q” lässt sich ein String Übergeben, der in Sprache synthetisiert wird. Leider wird nur ein String mit maximal 100 Zeichen akzeptiert, zumindest nach dem was ich gelesen habe. Im Deutschen sind es vermutlich weniger Zeichen, da bei mir schon mit Kürzeren Texten eine Fehlermeldung kam. Als Ausgabe liefert Google eine MP3 Datei, sobald man die URL aufruft.

Auf dieser Basis hat sich ein gewisser nxhoaf ein kleine Java-App gebastelt, mit der sich MP3 produzieren lassen. Ich hänge seinen Code hier mal an, falls der Link irgendwann tot sein sollte. Schaut recht übersichtlich aus, und ist zumindest ein Beispiel, wie die Google-API verwendet werden kann.

Inzwischen soll es auch eine TTS-API in Chrome geben. Ein interessanter Beitrag dazu findet man hier: Text-to-Speech API in Chrome. Der Autor beschreibt den Vorteil der Crome-Lösung folgendermaßen:

Es gab schon einige Erweiterungen für Chrome die einen Text in Sprach verwandelt haben, aber diese haben den Text an einen Server gesendet, der mit einer mp3-Datei geantwortet hat, die dann im Audio-Tag von HTML5 abgespielt wurde. Mit der API “Text-to-Speech” von Chrome ist das nicht mehr nötig. Alles findet nativ auf dem eigenen Rechner statt.

Nativ klingt doch interessant, da müsste man sich die Chrome-Engine genauer anschauen.

Mary TTS Engine

Eine weiter Online TTS-Engine, die ich gefunden habe findet man auf dieser Seite. Mary bietet ein HTTP-Interface an, über den sich neben der Sprache auch einige Effekte konfigurieren lassen können. Dadurch kann man auch den Klang der Stimme beeinflussen. Die Beschreibung dieses Interface kann man hier nachlesen.

Kommentare sind geschlossen.