Schon mal eine gute Computerstimme gehört?

Ich behaupte…

Oder Englisch:  Amy

Ja? Viele Telefonhotlines statten die automatische Call-Vermittlung schon lange mit synthetischen Stimmen aus. Diese Technik kann inzwischen jeder auf dem eigenen PC nutzen und sich z.B. e-Mails, Webseiten und e-Books vorlesen lassen.

UPDATE: Fragen Sie uns nach ReadSpeaker – damit haben wir alle unsere TTS-Anforderungen erfüllen können. hier… Text-To-Speech ist seit Windows 7 fester Bestandteil des Betriebssystems. In apple’s Betriebssystem Lion ist Technik von NUANCHE eingebaut. NUANCHE kauft nicht nur alle anderen Stimm-Hersteller auf, sondern ist wohl auch der von iphone Usern nutzbare Siri-Auskunfts-Service mit der Stimme, die auf Lion Samantha heißt. Wer sie mal sehen möchte, findet bei der Serie Big Bang Theory einen netten Gag..

Ein stark umkämpfter Markt und nur wenige Firmen entwickeln noch selbst. Der Markt konsolidiert sich, vermutlich sind die zahlungsfähigsten Kunden die Telefon-Anbieter und Hotline-Dienste. Einer der wenigen Europäischen Anbieter ist IVONA, übrigens Hightech aus Polen! Erstaunlich gut sind die englischen Stimmen. Viel mehr Sprachen kann ich nicht beurteilen. Neue deutsche Stimmen sind in Vorbereitung – das ist gut.

Diverse Serverdienste, Android-Unterstützung und sogar „Pay per Letter“ Service für ‚Lizenzfreie Sätze‘ gibt es bei IVONA. Diesen Service benötigt man für kleine Projekte, da kommerziell verwertbare Texte aus IVONA Stimmen erst mit teurer Zusatzlizenz erlaubt sind.

Probieren Sie mal: IVONA Sprachsynthese

In München gibt es den Anbieter Linguatec. Hier wird auch geforscht und entwickelt – aber keine eigenen Stimmen. Dafür interessante Server-Anwendungen. Zu Linguatec

Für Trainingsvideos lassen sich mit dem Voice-Reader-Studio von Linguatec schnell spannende Dialoge entwickeln, die natürlich nicht mit echten ausgebildeten Sprechern mithalten können, aber dafür um einiges kostengünstiger zu produzieren sind. Und die Computerstimme ist auch bei der 50igsten Änderung noch nicht genervt. Und das in verschiedenen Sprachen. Leider kann die Software nicht auf installierte SAPI 5 Stimmen zurückgreifen, sondern bringt ein eigenes System mit. Dafür Sind einige praktische Funktionen zur Dialoggestaltung enthalten, was andere Systeme nur mit XML-Codes ermöglichen.

Ein traditioneller Anbieter für SAPI 4 und SAPI 5 Stimmen  nutzende Software ist http://www.nextup.com. Dort gibt es mehrere Anwendungen, die z.T. auch für Menschen gedacht sind, die eine Unterstützung beim Sprechen benötigen.  z.B. NextUp-Talker und TextAloud, das gleich mit einem Museum an unbrauchbaren Stimmen aufwartet.

Aufpassen muss man aber überall mit den Lizenzbestimmungen. Wer mehr als private Nutzung vor hat braucht wie immer Rechte an den Tönen und Bildern. Alle Hersteller scheinen sich auch Rechte an den produzierten „Geräuschen“ einzuräumen – auch wenn sie keine Rechte an den Inhalten haben. Ob die wirklich einklagbar sind weiß ich nicht, aber gründliches Lesen der Nutzungsrechte ist angebracht um Rechtsstreit zu vermeiden. Wenn ich ein Keyboard oder eine Gitarrensaite kaufe, dann zahle ich doch auch nicht an den Keyboard-Sample Hersteller oder den Stahllieferanten für meine eigenen Stücke – oder doch? Ich finde es eine Merkwürdige Vorgehensweise. Bei Serveranwendungen ist das evtl. noch verständlich, wenn kontinuierlich neues entsteht will der Stimmhersteller mitverdienen.

Für alle Office-Programme gibt es mittlerweile Vorlese-Integrationen und natürlich auch Plugins für OpenOffice und LibreOffice sind schnell gefunden.

Aus England von Cereproc kommt eine österreichische Stimme Leopold (und viele Variationen englischer Sprachen), die sich im ersten Moment auch sehr gut anhören und manche Vokabel auch besser können. Der Sprechrhythmus gefällt mir bei Linguatec und IVONA aber besser.
Ich bin jedenfalls sehr neugierig, was hier noch zu erwarten ist. Einerseits eine starke Konzentration bei Nuanche. Andererseits innovative Stimmen aus Europa. Indisches Englisch und amerikanisches Spanisch gibts es schon und hier und dort auch XML-tags für Gefühle oder innere Haltungen, die ja mit jedem Wort ebenso transportiert werden. Da hören wir bei menschlichen Sprechern oft mehr als der Sprecher selbst sagen will. Vielleicht klingt bald die Hotline-Synthese am Abend auch erschöpft und genervt? Und was ist mit den 260 Sprachen die allein in Indien gesprochen werden? Also braucht es unsere Stimmen noch eine Weile. Das wäre wohl auch die Antwort von Siri. Der Film FREIgestellt (von Claus Strigel, Musik: Wolfgang Neumann) enthält neben animierten Darstellern auch synthetische Stimmen.

Gern erstellen wir für Sie Audiodateien aus Textdateien.

 

 

Mehr in e-Learning, Tipps
Foto: Sabine Menge pixelio.de
Spammschutz: AntiSpam Bee funktioniert auch

Datenschutz für Spammer? Ja - auch das ist nötuig. Akismet ist ein sehr Funktionstüchtiger Spam-Verhinderer und bei WordPress quasi vorinstalliert. Wer Kommentare in...

Schließen