Mehrfach annotierte Textkorpora (eBook)

Strukturierte Speicherung und Abfrage

(Autor)

eBook Download: PDF
2019 | 1. Auflage
315 Seiten
Narr Francke Attempto Verlag
978-3-8233-9286-6 (ISBN)

Lese- und Medienproben

Mehrfach annotierte Textkorpora - Roman Schneider
Systemvoraussetzungen
78,40 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Digitale Korpora haben die Voraussetzungen, unter denen sich Wissenschaftler mit der Erforschung von Sprachphänomenen beschäftigen, fundamental verändert. Umfangreiche Sammlungen geschriebener und gesprochener Sprache bilden mittlerweile die empirische Basis für mathematisch präzise Generalisierungen über zu beschreibende Wirklichkeitsausschnitte. Das Datenmaterial ist hochkomplex und besteht neben den Rohtexten aus diversen linguistischen Annotationsebenen sowie außersprachlichen Metadaten. Als unmittelbare Folge stellt sich die Konzeption adäquater Recherchelösungen als beträchtliche Herausforderung dar. Im vorliegenden Buch wird deshalb ein datenbankbasierter Ansatz vorgestellt, der sich der Problematiken multidimensionaler Korpusrecherchen annimmt. Ausgehend von einer Charakterisierung der Anforderungsmerkmale linguistisch motivierter Suchen werden Speicherungs- und Abfragestrategien für mehrfach annotierte Korpora entwickelt und anhand eines linguistischen Anforderungskatalogs evaluiert. Ein Schwerpunkt liegt dabei in der Einführung problemorientierter Segmentierung und Parallelisierung.

PD Dr. Roman Schneider leitet den Programmbereichs "Sprachtechnologie und Informationssysteme" am Institut für Deutsche Sprache (IDS) in Mannheim. Daneben engagiert er sich kontinuierlich in der akademischen Lehre, u.A. an den Universitäten Gießen, Leipzig, Mannheim, Trier und Augsburg.

1Einführung und Motivation

2Linguistische Anforderungen an Sprachkorpora
2.1Natürlichsprachliche Korpora in der Sprachwissenschaft
2.2Deutschsprachige Korpora im internationalen Kontext
2.3Recherche in ausgewählten Korpussammlungen
2.4Multidimensionale Suchkriterien
2.5Anforderungskatalog für linguistisch motivierte Korpusabfragen

3Design und Implementierung eines Korpusabfragesystems
3.1Spektrum der Speicherungsmodelle
3.2Ein Referenzsystem für die relationale Korpusspeicherung
3.3Evaluierung einzelner Designentscheidungen

4Evaluation des Anforderungskatalogs
4.1Abfrage 1: Einfaches Suchmuster
4.2Abfrage 2: Suffixsuche mit Platzhalterzeichen
4.3Abfrage 3: Komplexes Relativsatz-Muster
4.4Abfrage 4: ACI-Konstruktionen
4.5Abfrage 5: W-Fragen ohne Verb
4.6Abfrage 6: Movierung in virtuellen Subkorpora
4.7Abfrage 7: Genitivobjekte
4.8Abfrage 8: Partizipialphrase vor niederfrequentem Nomen
4.9Abfrage 9: Regulärer Ausdruck mit Rechts-Trunkierung
4.10Abfrage 10: Regulärer Ausdruck mit Links-Trunkierung
4.11Einflussfaktoren auf die Abfrage-Laufzeiten

5Versuch einer Laufzeitoptimierung durch segmentierte Abfragen
5.1Parallelisierung als Chance für das Korpusretrieval
5.2Problemorientierte Algorithmisierung
5.3Evaluation des alternativen Suchalgorithmus

6Integration in ein Online-Framework
6.1Suchformulare
6.2Speicherung von Beleglisten
6.3Schnittstellen zu Statistikwerkzeugen
6.4Übersichtslisten

7Zusammenfassung und Fazit

Literaturverzeichnis

Erscheint lt. Verlag 11.3.2019
Reihe/Serie Korpuslinguistik und Interdisziplinäre Perspektiven auf Sprache - Corpus Linguistics and Interdisciplinary Perspectives on Language (CLIP)
Verlagsort Tübingen
Sprache deutsch
Themenwelt Geisteswissenschaften Sprach- / Literaturwissenschaft Germanistik
Schlagworte Annotationen • Korpusrecherche • Retrieval • Sprachkorpora • Textdatenbanken
ISBN-10 3-8233-9286-7 / 3823392867
ISBN-13 978-3-8233-9286-6 / 9783823392866
Haben Sie eine Frage zum Produkt?
PDFPDF (Wasserzeichen)
Größe: 8,9 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Eine Einführung - Bearbeitet von Cordula Kropik, Stefan Rosmer und …

von Gert Hübner

eBook Download (2023)
UTB GmbH (Verlag)
28,99
Arbeitsbuch zur Grammatik der älteren deutschen Sprachstufen und zur …

von Rolf Bergmann; Claudine Moulin; Nikolaus Ruge

eBook Download (2023)
UTB GmbH (Verlag)
21,99