Deep Learning-basierte Vorhersage der Sprachqualität
Springer International Publishing (Verlag)
978-3-031-38586-5 (ISBN)
- Noch nicht erschienen - erscheint am 14.02.2025
- Versandkostenfrei innerhalb Deutschlands
- Auch auf Rechnung
- Verfügbarkeit in der Filiale vor Ort prüfen
- Artikel merken
Dieses Buch zeigt, wie man die neuesten Methoden des maschinellen Lernens (Deep Learning) für die Vorhersage der Sprachqualität einsetzen kann. Der Autor zeigt, wie die jüngsten Fortschritte im Bereich des maschinellen Lernens für die Aufgabe der Sprachqualitätsvorhersage genutzt werden können und bietet eine eingehende Analyse der Eignung verschiedener Deep-Learning-Architekturen für diese Aufgabe. Der Autor zeigt dann, wie das resultierende Modell herkömmliche Sprachqualitätsmodelle übertrifft und zusätzliche Informationen über die Ursache einer Qualitätsbeeinträchtigung durch die Vorhersage der Sprachqualitätsdimensionen Rauschen, Färbung, Diskontinuität und Lautheit liefert.
lt;p>Gabriel Mittag erhielt seinen B.Sc. und M.Sc. in Elektrotechnik und Elektronik an der Technischen Universität Berlin. Während seines Masterstudiums verbrachte er zwei Semester an der RMIT University in Melbourne, Australien und beschäftigte sich vor allem mit biomedizinischer und Sprachsignalverarbeitung. Ab 2016 war er als wissenschaftlicher Mitarbeiter am Quality and Usability Lab der TU Berlin tätig und promovierte dort über die maschinelle lernbasierte Vorhersage von Sprachqualität. Im Mai 2021 begann Gabriel Mittag als Machine Learning Scientist bei Microsoft in Redmond, WA, USA.
1.Einführung.- 2. Qualitätsbewertung der übertragenen Sprache - 3. Neuronale Netzwerkarchitekturen für die Vorhersage der Sprachqualität - 4. Doppelendige Sprachqualitätsvorhersage mit Siamesischen Netzen.- 5. Vorhersage von Sprachqualitätsdimensionen mit Multi-Task-Lernen - 6. Bias-Aware Loss für das Training aus mehreren Datensätzen.- 7. NISQA - Ein einseitiges Sprachqualitätsmodell.- 8. Schlussfolgerungen.- A. Datensatz-Zustandstabellen.- B. Dimensionshistogramme für Trainings- und Validierungsdatensätze.- Referenzen.
Erscheinungsdatum | 04.10.2024 |
---|---|
Zusatzinfo | XIV, 174 S. 59 Abb., 54 Abb. in Farbe. |
Verlagsort | Cham |
Sprache | deutsch |
Original-Titel | Deep Learning Based Speech Quality Prediction |
Maße | 155 x 235 mm |
Themenwelt | Technik ► Elektrotechnik / Energietechnik |
Schlagworte | Deep learning • Maschinelles Lernen • Qualität der Dienstleistung • Qualität der Erfahrung • Sprachqualität |
ISBN-10 | 3-031-38586-1 / 3031385861 |
ISBN-13 | 978-3-031-38586-5 / 9783031385865 |
Zustand | Neuware |
Informationen gemäß Produktsicherheitsverordnung (GPSR) | |
Haben Sie eine Frage zum Produkt? |
aus dem Bereich