POS-Tagging für Transkripte gesprochener Sprache (eBook)

Entwicklung einer automatisierten Wortarten-Annotation am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)
eBook Download: PDF
2020 | 1. Auflage
417 Seiten
Narr Francke Attempto Verlag
978-3-8233-9361-0 (ISBN)

Lese- und Medienproben

POS-Tagging für Transkripte gesprochener Sprache - Swantje Westpfahl
Systemvoraussetzungen
0,00 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Der Band leistet eine theoretisch begründete und empirisch validierte Entwicklung einer automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte spontansprachlicher Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), das über die Datenbank für Gesprochenes Deutsch der Forschungsgemeinschaft öffentlich zugänglich ist. Dabei setzt er zwei Schwerpunkte: erstens die theoretische Aufarbeitung von Unterschieden von Transkripten gesprochener Sprache zu schriftsprachlichen Daten in Hinblick auf die Entwicklung eines Tagsets für das gesprochene Deutsch; zweitens die Darstellung der empirischen Arbeitsschritte zur Erstellung des automatisierten Part-of-Speech-Taggings, d. h. die Implementierung und Evaluierung für die Annotation des FOLK-Korpus. Der Band ist eine kritische Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit. Er gibt Einblicke über die Korpusaufbereitung von Transkripten gesprochener Sprache und stellt diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.

Die Autorin hat für ihre Arbeit 2020 den Peter-Roschy-Preis des Vereins der Freunde des Leibniz-Instituts für Deutsche Sprache erhalten.

Frau Swantje Westpfahl war bisher wissenschaftliche Mitarbeiterin am Leibniz-Institut für Deutsche Sprache und ist seit August E-Learning-Projektleiterin bei der Intelligent Media Systems in Karlsruhe.

1. Einleitung
1.1 Was ist Part-of-Speech-Tagging?
1.2 Inhalt und Aufbau der Untersuchung
1.3 Datengrundlage FOLK
1.4 Related Work
1.5 Pilotstudie
1.6 Zielsetzung der Untersuchung
2. Theoretische Grundlagen
2.1 Grammatik der gesprochenen Sprache
2.2 Segmentierung von Transkripten gesprochener Sprache
2.3 Kontext und Multimodalität in der Face-to-Face-
2.4 Wortarten in der gesprochenen Sprache
2.5 Weitere Klassifikationsprobleme
3. Empirischer Teil
3.1 Zielsetzung der empirischen Arbeit
3.2 Überblick über die empirische Vorgehensweise
3.3 Auswahl des Taggers und des Tagsets
3.4 Funktionsweise des Taggers
3.5 Möglichkeiten der Anpassung des Taggers und des Tagsets
3.6 Erstellen des Goldstandards
3.7 Erste Anpassung des Tagsets und der Guidelines
3.8 Manuelle Korrektur des Development-Sets
3.9 Inter-Annotator-Agreement zur manuellen Korrektur des
Development-Sets
3.10 Einführung eines Post-Processings
3.11 Zweite Anpassung der Guidelines
3.12 Entwicklung eines automatisierten Taggings anhand des Development-Sets
3.13 Manuelle Korrektur des Goldstandard-Sets
3.14 Entwicklung eines automatisierten Taggings anhand des Goldstandards
3.15 Evaluation des POS-Taggings für spontansprachliche Daten
3.16 Fazit
4. Abschließende Diskussion und Ausblick
5. Literatur
6. Anhang

Erscheint lt. Verlag 30.3.2020
Reihe/Serie Studien zur deutschen Sprache
Verlagsort Tübingen
Sprache deutsch
Themenwelt Geisteswissenschaften Sprach- / Literaturwissenschaft Germanistik
Schlagworte Annotation • Computerlinguistik • Gesprochene-Sprache-Forschung • Korpusaufbereitung • POS-Tagging • Transkripte • Wortarten
ISBN-10 3-8233-9361-8 / 3823393618
ISBN-13 978-3-8233-9361-0 / 9783823393610
Haben Sie eine Frage zum Produkt?
PDFPDF (Wasserzeichen)
Größe: 18,1 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Eine Einführung - Bearbeitet von Cordula Kropik, Stefan Rosmer und …

von Gert Hübner

eBook Download (2023)
UTB GmbH (Verlag)
28,99
Arbeitsbuch zur Grammatik der älteren deutschen Sprachstufen und zur …

von Rolf Bergmann; Claudine Moulin; Nikolaus Ruge

eBook Download (2023)
UTB GmbH (Verlag)
21,99