Sprecherunabhängigkeit und Sprecheradaption - Bernhard R. Kämmerer

Sprecherunabhängigkeit und Sprecheradaption

Lösungsansätze für das Problem des Sprecherwechsels bei der automatischen Spracherkennung
Buch | Softcover
VIII, 110 Seiten
1990
Springer Berlin (Verlag)
978-3-540-52789-3 (ISBN)
54,99 inkl. MwSt
Bei automatischen Spracherkennungssystemen erweist sich ein Wechsel des Sprechers als besonderes Problem: Ein zuvor durch eine andere Person trainiertes Erkennungssystem hat eine deutlich erhöhte Fehlerwahrscheinlichkeit. Das vorliegende Buch beschäftigt sich mit Lösungsmöglichkeiten, wobei Ansätze sowohl für eine sprecherunabhängige als auch für eine sprecheradaptive Erkennung entwickelt werden. Nach einer Einführung und einer Übersicht über bisherige Ansätze wird das den Untersuchungen zugrunde liegende Spracherkennungssystem vorgestellt. Ein Kapitel über die Verbesserung der sprecherunabhängigen Erkennung stellt der klassischen Methode multipler Referenzmuster neue Ansätze gegenüber. Im anschließenden Kapitel werden verschiedene sprecheradaptive Verfahren entwickelt. Aus dem Vortragen eines geeigneten Adaptionswortschatzes durch einen neuen Sprecher werden Muster gewonnen, die eine zielgerichtete Modifikation des Erkennungssystems an die geänderten Sprechcharakteristika erlauben. Für sämtliche Ansätze sowie für geeignete Verfahrenskombinationen werden experimentell bestimmte Fehlerraten angegeben, wobei das den Testläufen zugrunde gelegte Datenmaterial aussagekräftige Ergebnisse erlaubt.

1 Einleitung.- 2 Sprecherunabhängigkeit und Spreeheradaption.- 2.1 Ursachen sprecherspezifischer Eigenheiten bei der Erzeugung von Sprache.- 2.2 Aufgaben und Ansätze.- 2.3 Literaturübersicht zur sprecherunabhängigen Erkennung und zur Sprecheradaption.- 2.4 Zielsetzung und Überblick.- 3 Das Erkennungssystem.- 3.1 Berechnung von signalbeschreibenden Merkmalen.- 3.2 Überwachte Zuweisung von Phonemklassen.- 3.3 Quantisierungsstrategien.- 3.4 Repräsentation analysierter Wörter.- 3.5 Ähnlichkeitsbestimmung und hierarchische Klassifikation.- 4 Verbesserung der sprecherunabhängigen Erkennung.- 4.1 Mehrfache Referenzmuster.- 4.2 Gemittelte Zeit-und Merkmalstrukturen.- 4.3 Gemittelte Zeitstruktur mit Mehrfaeh-Merkmalen.- 4.4 Wortspezifische Quantisierungsschwellen.- 4.5 Zusammenfassung.- 5 Ansätze für die Sprecheradaption.- 5.1 Merkmalorientierte und phonemorientierte Adaption.- 5.2 Überwachte oder nichtüberwachte Adaption.- 5.3 Einbindung der Adaption in ein Erkennungssystem.- 5.4 Bestimmung eines geeigneten Adaptionswortschatzes.- 5.5 Zuordnung korrespondierender Merkmale zweier Sprecher.- 5.6 Erzeugung adaptierter Lexika.- 5.7 Zusammenfassung.- 6 Testdurchführung.- 6.1 Kriterien zur Wahl des Wortschatzes.- 6.2 Aufnahme und Vorbehandlung der Sprachdaten.- 6.3 Auswahl der Sprecher.- 6.4 Verfahrenskombinationen und Ergebnisse.- 7 Schlußbetrachtungen.- Anhang: Testvokabular und Adaptionswortschätze.- Literatur.

Erscheint lt. Verlag 10.7.1990
Reihe/Serie Informatik-Fachberichte
Zusatzinfo VIII, 110 S. 15 Abb.
Verlagsort Berlin
Sprache deutsch
Maße 170 x 242 mm
Gewicht 235 g
Themenwelt Mathematik / Informatik Informatik Software Entwicklung
Informatik Theorie / Studium Künstliche Intelligenz / Robotik
Medizin / Pharmazie Studium
Naturwissenschaften Biologie Humanbiologie
Schlagworte Automatische Spracherkennung • Klassen • Klassifikation • optimierte Zeitstruktur • Spracherkennung • Sprecheradaption • Sprecherunabhängigkeit • Wortschatz
ISBN-10 3-540-52789-3 / 3540527893
ISBN-13 978-3-540-52789-3 / 9783540527893
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich
von absurd bis tödlich: Die Tücken der künstlichen Intelligenz

von Katharina Zweig

Buch | Softcover (2023)
Heyne (Verlag)
20,00