Spätestens seit der steigenden Verbreitung der smarten Assistenten ist die Erkennung und Ausgabe von Sprache eine wichtige Aufgabe und wird von den Unternehmen immer weiter entwickelt. Google hat nun nach eigenen Aussagen mit einem neuen System so große Fortschritte gemacht, dass die Ausgabe der Sprache nicht mehr von einem Menschen unterschieden werden kann. Mit einer Sammlung von mehr als zwei Dutzend Beispielen kann sich jeder ein eigenes Bild machen.
Google hat nicht nur eine starke Spracherkennung, sondern hat auch bei der Sprachausgabe in den letzten Jahren große Fortschritte gemacht und diese immer weiter auf die richtige Betonung trainiert. Zumindest für die englische Sprachausgabe wird seit wenigen Stunden ein Update ausgerollt, dass die Qualität der Sprache dramatisch verbessert und endlich nicht mehr von der ersten Sekunde den Eindruck vermittelt, dass der Text von einer Maschine vorgelesen wird.
Auf jedem von Google zertifizierten Android-Smartphone ist die Google Text-to-Speech Engine vorinstalliert und ermöglicht das vorlesen von Texten in vielen verschiedenen Sprachen. Normalerweise bleibt das Tool im Hintergrund und verrichtet seine Arbeit in Form von Unterstützung für andere Apps. Jetzt hat diese ein größeres Update bekommen, das ihr einige neue Sprachen und viele neue Stimmen beibringt.
Translate

Seit der Einführung des neuen Google Translate hat sich sehr Vieles geändert. So wurde in der Zeit viel verbessert, die Ideen der Translate-Engine sind in die Suche gewandert und auch Googles Chrome hat eine Übersetzung verpasst bekommen. Dass Googles Translate auch vorlesen kann, mag selbstverständlich klingen, so hat der Übersetzer aber bei "schwierigen Sprachen", wie Chinesisch, seine Probleme gehabt.

Heute hat man 27 neue Text-to-speech-Sprachen in Google Translate integriert. Damit kann Translate nun übersetzen und zusätzlich in den Sprachen Afrikaans, Albanisch, Katalanisch, Chinesisch (Mandarin), Kroatisch, Tschechisch, Dänisch, Niederländisch, Finnisch, Griechisch, Ungarisch, Isländisch, Indonesisch, Lettisch, Mazedonisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Serbisch, Slowakisch, Suaheli, Schwedisch, Türkisch, Vietnamesisch und Walisisch vorlesen. 

Möglich macht das die neue eSpeak-Engine, bei der sich Google bedient hat. Sie ist Open Source und lässt sich einfach integrieren. Sie hat aber einen entscheidenden Nachteil: Sie ist weder mit der "bisherigen" TTS-Technologie vergleichbar, noch hört sie sich klar an. Dies alles will Google aber optimieren und verbessern.

» Translate Blog
» Google Translate 
YouTube Das Google Research-Team hat mal wieder ein sehr interessante Tool veröffentlicht: Die Abteilung Spracherkennung scheint mittlerweile so sehr auf die eigene Technologie zu vertrauen, dass man jetzt ein Gadget für iGoogle veröffentlicht hat mit dem die Videos aller US-Präsidentschaftskandidaten nach einzelnen Wörtern durchsucht werden können.iGoogle Gadget Spracherkennung
Das Gadget ist ganz einfach zu bedienen: Einfach das gewünschte Wort einzugeben und eventuell noch auswählen ob nur Videos von Obama oder McCain oder aller Kandidaten durchsucht werden soll. Am unteren Ende des Gadgets wird eine Liste mit Videos angezeigt in denen die Wörter vorkommen. Spielt man das Video ab, kann man direkt zu der Stelle springen an dem das Wort fällt. Die entsprechende Position ist im Video gelb markiert.Zum Startschuss des großangelegten Tests werden nur Videos der Präsidentschaftskandidaten auf YouTube, oder YouChoose durchsucht. Google gibt zwar an, dass das ganze vielleicht nicht 100%ig zuverlässig funktioniert, aber scheint sich doch so sicher zu sein, das ganze bei einem doch relativ wichtigen Thema auszuprobieren und auch das Beta-Label sucht man in diesem Fall vergeblich.Getestet und trainiert wurde die Spracherkennung schon seit langer Zeit mit Goog-411. Durch dieses Angebot hat Google nahezu jeden Dialekt und Stimmlage und auch verschiedene Aussprachen bereits aufgenommen und untersucht. Ich denke wenn das ganze jetzt bei Obama & Co. gut funktioniert, könnte man dieses Feature demnächst auch standardmäßig bei YouTube finden.Sicherlich wird es eine ganze Zeit lang dauern _alle_ Videos bei YouTube nach bestimmten Texten und Wörtern zu durchsuchen und entsprechend zu indizieren, aber ich könnte wetten dass das YouTube-Team bereits damit begonnen hat. Wenn die Spracherkennung wirklich reibungslos funktioniert ist das doch mal wieder eine schöne Innovation mit der Tags & Co. praktisch schon überflüssig werden - wenn entsprechend viel im Video gesprochen wird.» Gadget zu iGoogle hinzufügen » Ankündigung im Google-Blog