Sprachsynthese und Spracherkennung mit gemeinsamen Datenbasen
Sprachmodell und Aussprachemodellierung
Seiten
2008
TUDpress Verlag der Wissenschaften Dresden
978-3-940046-65-9 (ISBN)
TUDpress Verlag der Wissenschaften Dresden
978-3-940046-65-9 (ISBN)
- Titel ist leider vergriffen;
keine Neuauflage - Artikel merken
Aktuelle Sprachsynthesesysteme erreichen bereits eine hohe Synthesequalität, obwohl es der synthetischen Sprache im Vergleich zur natürlichen noch stark an Umgangssprachlichkeit und Natürlichkeit mangelt. Diese Arbeit versucht die festen Produktionsregularien im Sprachsyntheseprozess zu überwinden, indem die Wortdauer variiert wird. Diese Variation erfolgt auf der Grundlage, dass häufiger auftretende Wörter schneller gesprochen werden als seltenere. Gleichzeitig treten durch eine schnellere Sprechweise oft Verschleifungen, Transformationen und/oder Auslassungen von Lauten auf, die als Aussprachevarianten modelliert werden können. Durch die Modellierung von Aussprachevarianten und deren Einsatz im Sprachsyntheseprozess
kann eine Dauervariation der Wörter indirekt über eine veränderte Lautfolge erfolgen. Durch die Einführung eines Sprachmodells basierend auf Aussprachevarianten kann zudem sichergestellt werden, dass nur aufeinander abgestimmte und zusammengehörige Varianten ausgewählt werden. Die Einführung von Sprachmodell und Aussprachevarianten wird in verschiedenen Ausbaustufen erläutert. Die Auswertung umfangreicher Hörtests zeigt die Qualitätsteigerung vor allem in Hinblick auf Natürlichkeit und Umgangssprachlichkeit. Diese Arbeit ist eingebettet in eine Reihe weiterer Arbeiten zur Entwicklung eines integrierten Systems unter Verwendung gleicher Datenbasen sowohl für die Sprachsynthese als auch Erkennung. Durch diesen vereinigenden Ansatz wird es möglich, in jeder Verarbeitungsebene zueinander inverse Algorithmen zu verwenden, die auf gleiche Wissensquellen zugreifen. In diesem Sinne wird im Rahmen der vorliegenden Arbeit ebenfalls das Potential eines Sprachmodells mit Aussprachevarianten, das in der Sprachsynthese eingesetzt wurde, für den Spracherkennungsprozess aufgezeigt.
kann eine Dauervariation der Wörter indirekt über eine veränderte Lautfolge erfolgen. Durch die Einführung eines Sprachmodells basierend auf Aussprachevarianten kann zudem sichergestellt werden, dass nur aufeinander abgestimmte und zusammengehörige Varianten ausgewählt werden. Die Einführung von Sprachmodell und Aussprachevarianten wird in verschiedenen Ausbaustufen erläutert. Die Auswertung umfangreicher Hörtests zeigt die Qualitätsteigerung vor allem in Hinblick auf Natürlichkeit und Umgangssprachlichkeit. Diese Arbeit ist eingebettet in eine Reihe weiterer Arbeiten zur Entwicklung eines integrierten Systems unter Verwendung gleicher Datenbasen sowohl für die Sprachsynthese als auch Erkennung. Durch diesen vereinigenden Ansatz wird es möglich, in jeder Verarbeitungsebene zueinander inverse Algorithmen zu verwenden, die auf gleiche Wissensquellen zugreifen. In diesem Sinne wird im Rahmen der vorliegenden Arbeit ebenfalls das Potential eines Sprachmodells mit Aussprachevarianten, das in der Sprachsynthese eingesetzt wurde, für den Spracherkennungsprozess aufgezeigt.
Reihe/Serie | Studientexte zur Sprachkommunikation ; 48 |
---|---|
Zusatzinfo | zahlr. Abb. u. Tab. |
Sprache | deutsch |
Maße | 170 x 240 mm |
Einbandart | kartoniert |
Themenwelt | Technik ► Elektrotechnik / Energietechnik |
Schlagworte | HC/Technik/Elektronik, Elektrotechnik, Nachrichtentechnik |
ISBN-10 | 3-940046-65-5 / 3940046655 |
ISBN-13 | 978-3-940046-65-9 / 9783940046659 |
Zustand | Neuware |
Haben Sie eine Frage zum Produkt? |
Mehr entdecken
aus dem Bereich
aus dem Bereich
Kolbenmaschinen - Strömungsmaschinen - Kraftwerke
Buch | Hardcover (2023)
Hanser (Verlag)
49,99 €