Automatischer Erwerb von linguistischem Wissen
Ein Ansatz zur Inferenz von DATR-Theorien
Seiten
1996
|
1. Reprint 2017
De Gruyter (Verlag)
978-3-484-30352-2 (ISBN)
De Gruyter (Verlag)
978-3-484-30352-2 (ISBN)
Die Buchreihe Linguistische Arbeiten (LA) trägt wesentlich zur aktuellen linguistischen Theoriebildung im Bereich der allgemeinen und einzelsprachlichen Linguistik bei. Veröffentlicht werden hochwertige Arbeiten, die aktuelle Fragestellungen bearbeiten und die Entwicklung der Sprachwissenschaft, synchron oder diachron, empirisch oder theoretisch orientiert, vorantreiben.
In dieser Arbeit wird ein Verfahren entwickelt, mit dem strukturierte linguistische Beschreibungen maschinell erzeugt werden. Ausgangspunkt für eine zu erstellende Beschreibung ist eine Menge von Einzeldaten, die einen bestimmten linguistischen Gegenstandsbereich charakterisieren. Das aus diesen Daten automatisch gewonnene linguistische Wissen wird in der Sprache DATR repräsentiert, einem innerhalb der Computerlinguistik entwickelten vererbungsbasierten Formalismus zur Repräsentation lexikalischer Information. Die Strukturierung eines gegebenen linguistischen Bereiches erfolgt über die Identifikation und Repräsentation von Beziehungen zwischen den Einzeldaten, durch Generalisierung über den Daten sowie durch Abstraktion von ihren Eigenschaften, was zur Repräsentation linguistischer Klassen führt. Das Lernverfahren, das diese Strukturierung leistet, basiert auf einer Menge von Regeln, die Vererbungsbeziehungen zwischen einzelnen Daten herstellen, und einem Algorithmus, der durch die Inferenz von Default-Information über den Daten generalisiert. Da für eine gegebene Menge von Daten viele unterschiedliche Beschreibungen möglich sind, werden Gütekriterien verwendet, die bestimmen, wodurch sich eine gute Beschreibung für einen konkreten Phänomenbereich auszeichnet. Durch den formalen Vergleich von Beschreibungen in DATR anhand dieser Kriterien erfolgt die Auswahl des Ereignisses. Die Leistungsfähigkeit des implementierten Verfahrens wird durch Anwendungen auf linguistische Daten aus zwei unterschiedlichen Bereichen gezeigt. In der ersten Gruppe von Aufgaben werden Flexionsklassen auf Grund flektierter Substantivformen des Deutschen gebildet. In den Aufgaben des zweiten Bereichs werden Verben auf Grund ihrer syntaktischen Eigenschaften klassifiziert.
In dieser Arbeit wird ein Verfahren entwickelt, mit dem strukturierte linguistische Beschreibungen maschinell erzeugt werden. Ausgangspunkt für eine zu erstellende Beschreibung ist eine Menge von Einzeldaten, die einen bestimmten linguistischen Gegenstandsbereich charakterisieren. Das aus diesen Daten automatisch gewonnene linguistische Wissen wird in der Sprache DATR repräsentiert, einem innerhalb der Computerlinguistik entwickelten vererbungsbasierten Formalismus zur Repräsentation lexikalischer Information. Die Strukturierung eines gegebenen linguistischen Bereiches erfolgt über die Identifikation und Repräsentation von Beziehungen zwischen den Einzeldaten, durch Generalisierung über den Daten sowie durch Abstraktion von ihren Eigenschaften, was zur Repräsentation linguistischer Klassen führt. Das Lernverfahren, das diese Strukturierung leistet, basiert auf einer Menge von Regeln, die Vererbungsbeziehungen zwischen einzelnen Daten herstellen, und einem Algorithmus, der durch die Inferenz von Default-Information über den Daten generalisiert. Da für eine gegebene Menge von Daten viele unterschiedliche Beschreibungen möglich sind, werden Gütekriterien verwendet, die bestimmen, wodurch sich eine gute Beschreibung für einen konkreten Phänomenbereich auszeichnet. Durch den formalen Vergleich von Beschreibungen in DATR anhand dieser Kriterien erfolgt die Auswahl des Ereignisses. Die Leistungsfähigkeit des implementierten Verfahrens wird durch Anwendungen auf linguistische Daten aus zwei unterschiedlichen Bereichen gezeigt. In der ersten Gruppe von Aufgaben werden Flexionsklassen auf Grund flektierter Substantivformen des Deutschen gebildet. In den Aufgaben des zweiten Bereichs werden Verben auf Grund ihrer syntaktischen Eigenschaften klassifiziert.
Erscheint lt. Verlag | 9.9.1996 |
---|---|
Reihe/Serie | Linguistische Arbeiten ; 352 |
Zusatzinfo | Num. figs. |
Verlagsort | Berlin/Boston |
Sprache | deutsch |
Maße | 170 x 240 mm |
Gewicht | 410 g |
Themenwelt | Schulbuch / Wörterbuch ► Wörterbuch / Fremdsprachen |
Geisteswissenschaften ► Sprach- / Literaturwissenschaft ► Germanistik | |
Geisteswissenschaften ► Sprach- / Literaturwissenschaft ► Sprachwissenschaft | |
Schlagworte | Automatismus • Computational Learning Theory • Computational Linguistics • Hardcover, Softcover / Deutsche Sprachwissenschaft, Deutschsprachige Literaturwi • HC/Deutsche Sprachwissenschaft, Deutschsprachige Literaturwissenschaft • Linguistik • Linguistische Datenverarbeitung • Linguistisches Wissen • Maschinelles Lernen • Spracherwerb • Wissensrepräsentationssprache |
ISBN-10 | 3-484-30352-2 / 3484303522 |
ISBN-13 | 978-3-484-30352-2 / 9783484303522 |
Zustand | Neuware |
Haben Sie eine Frage zum Produkt? |
Mehr entdecken
aus dem Bereich
aus dem Bereich
Eine Einführung in die diachrone Sprachwissenschaft des Deutschen
Buch | Softcover (2021)
UTB (Verlag)
20,90 €