POS-Tagging für Transkripte gesprochener Sprache - Swantje Westpfahl

POS-Tagging für Transkripte gesprochener Sprache

Entwicklung einer automatisierten Wortarten-Annotation am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)
Buch | Softcover
417 Seiten
2020 | 1. Auflage
Narr Francke Attempto (Verlag)
978-3-8233-8361-1 (ISBN)
118,00 inkl. MwSt
Der Band stellt die Entwicklung einer automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte spontansprachlicher Daten des größten Korpus für gesprochenes Deutsch (FOLK) dar. Er ist als eine kritische Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit zu lesen. Viele Beispiele geben Einblicke in die Korpusaufbereitung von Transkripten gesprochener Sprache und stellen diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.

Die Autorin hat für ihre Arbeit 2020 den Peter-Roschy-Preis des Vereins der Freunde des Leibniz-Instituts für Deutsche Sprache erhalten.
Der Band leistet eine theoretisch begründete und empirisch validierte Entwicklung einer automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte spontansprachlicher Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), das über die Datenbank für Gesprochenes Deutsch der Forschungsgemeinschaft öffentlich zugänglich ist. Dabei setzt er zwei Schwerpunkte: erstens die theoretische Aufarbeitung von Unterschieden von Transkripten gesprochener Sprache zu schriftsprachlichen Daten in Hinblick auf die Entwicklung eines Tagsets für das gesprochene Deutsch; zweitens die Darstellung der empirischen Arbeitsschritte zur Erstellung des automatisierten Part-of-Speech-Taggings, d. h. die Implementierung und Evaluierung für die Annotation des FOLK-Korpus. Der Band ist eine kritische Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit. Er gibt Einblicke über die Korpusaufbereitung von Transkripten gesprochener Sprache und stellt diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.Die Autorin hat für ihre Arbeit 2020 den Peter-Roschy-Preis des Vereins der Freunde des Leibniz-Instituts für Deutsche Sprache erhalten.

Frau Swantje Westpfahl war bisher wissenschaftliche Mitarbeiterin am Leibniz-Institut für Deutsche Sprache und ist seit August E-Learning-Projektleiterin bei der Intelligent Media Systems in Karlsruhe.

1. Einleitung
1.1 Was ist Part-of-Speech-Tagging?
1.2 Inhalt und Aufbau der Untersuchung
1.3 Datengrundlage FOLK
1.4 Related Work
1.5 Pilotstudie
1.6 Zielsetzung der Untersuchung
2. Theoretische Grundlagen
2.1 Grammatik der gesprochenen Sprache
2.2 Segmentierung von Transkripten gesprochener Sprache
2.3 Kontext und Multimodalität in der Face-to-Face-
2.4 Wortarten in der gesprochenen Sprache
2.5 Weitere Klassifikationsprobleme
3. Empirischer Teil
3.1 Zielsetzung der empirischen Arbeit
3.2 Überblick über die empirische Vorgehensweise
3.3 Auswahl des Taggers und des Tagsets
3.4 Funktionsweise des Taggers
3.5 Möglichkeiten der Anpassung des Taggers und des Tagsets
3.6 Erstellen des Goldstandards
3.7 Erste Anpassung des Tagsets und der Guidelines
3.8 Manuelle Korrektur des Development-Sets
3.9 Inter-Annotator-Agreement zur manuellen Korrektur des
Development-Sets
3.10 Einführung eines Post-Processings
3.11 Zweite Anpassung der Guidelines
3.12 Entwicklung eines automatisierten Taggings anhand des Development-Sets
3.13 Manuelle Korrektur des Goldstandard-Sets
3.14 Entwicklung eines automatisierten Taggings anhand des Goldstandards
3.15 Evaluation des POS-Taggings für spontansprachliche Daten
3.16 Fazit
4. Abschließende Diskussion und Ausblick
5. Literatur
6. Anhang

Erscheinungsdatum
Reihe/Serie Studien zur deutschen Sprache ; 83
Sprache deutsch
Maße 155 x 230 mm
Gewicht 698 g
Themenwelt Geisteswissenschaften Sprach- / Literaturwissenschaft Germanistik
Geisteswissenschaften Sprach- / Literaturwissenschaft Sprachwissenschaft
Schlagworte Annotation • Computerlinguistik • Gesprochene-Sprache-Forschung • Korpusaufbereitung • POS-Tagging • Transkripte • Wortarten
ISBN-10 3-8233-8361-2 / 3823383612
ISBN-13 978-3-8233-8361-1 / 9783823383611
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich
Eine Einführung in die diachrone Sprachwissenschaft des Deutschen

von Peter Ernst

Buch | Softcover (2021)
UTB (Verlag)
20,90