Automatische Schreibfehlerkorrektur in Texten - R.-J. Fischer

Automatische Schreibfehlerkorrektur in Texten

Anwendung auf ein medizinisches Lexikon

(Autor)

Buch | Softcover
X, 96 Seiten
1980
Springer Berlin (Verlag)
978-3-540-09982-6 (ISBN)
54,99 inkl. MwSt
Der Vergleich von Zeichenreihen oder allgemeiner Bltketten spielt in der Dalenverarbeitung eine zentrale Rolle. Bei vielen Problemen genugt eine Unterscheidung von Gleichheit und Ungleichheit zweier Zeichen reihen nicht, sondern es mussen definierte Abstufungen von "Ahnlichkeil" betrachtet werden. Die Auf gabe kann etwa darin bestehen, eine vorgegebene Zeichenreihe durch eine ihr ahnliche Zeichenreihe zu ersetzen, um etwa eine Normierung, elne Klassifikation oder auch eine Korrektur durchzufUhren. Das vorliegende Buch beschaftigt sich mit der letzten Moglichkeit. Aus der Literatur sind viele Ahnlichkeitsdefinitionen und daraus resultierende Korrektur-Algorithmen be kannt, die nicht allgemein werlend miteinander verglichen werden konnen, da sie sowohl auf die erfor derlichen Arten von Korrekturen als auch auf die Eigenheiten der zu korrigierenden Zeichenreihen zu geschnitten sind. Es wird sich jedoch zeigen, daB Korrektur-Algorithmen, die dem sogenannten HAMMING Prinzip genugen, allen ancjeren uberlegen sind. Ein solcher Algorithmus, der Schreibfehler korrigierel1 5011, wird hier beschrieben und auf ein spezielles Lexikon medizinischer Begriffe angewendet. Die berucksichtigten Fehlerarten und ihre Bewertungen ha ben dabei nicht nur Beispielcharakter, wie man der Literatur entnehmen kann. Derselbe Algorithmus kann daher, gar nichl oder nach Bedarf geringfUgig verandert, fur die Korrektur andersartiger Zeichenreihen eingesetzt werden. Daruber hinaus wird versucht, moglichst aile bekannten Algorithmen vorzustellen und zu diskutieren, die gegenuber dem hier beschriebenen Algorithmus bei veranderter Problemstellung Vorzuge haben konnten. Eine erschOpfende Behandlung aller bekannten Algorithmen ist in diesem Rahmen aber nicht ]11oglich.

1 Einleitung.- 2 Publizierte Verfahren.- 2.1 Abgrenzung des Problems.- 2.2 Schema der automatischen Schreibfehlerkorrektur.- 2.3 Definitionen.- 2.4 Verfahren mit zeichenabhängigen Distanzen.- 2.5 Verfahren mit positionsabhängigen Distanzen.- 2.6 Verfahren mit Distanzen, die vom Zeichenvorrat abhängen.- 2.7 Verfahren mit Distanzen, die von den Positionen der Zeichen und vom Zeichenvorrat abhängen.- 2.8 Verfahren mit Distanzen, die von gemeinsamen Zeichenfolgen abhängen.- 2.9 Verfahren, die nur bestimmte Fehler berücksichtigen.- 2.10 Verfahren nach dem HAMMING-Prinzip.- 3 Vorgaben für das eigene Verfahren.- 3.1 Beschreibung des zugrunde gelegten Lexikons.- 3.2 Angenommene Fehlerquellen.- 3.3 Untersuchung zu erwartender Fehlerarten.- 3.4 Das HAMMING-Prinzip für die Auswahl der Kandidaten.- 3.5 Brauchbarkeit der bekannten Verfahren für die automatische Schreibfehlerkorrektur.- 3.6 Folgerungen für das eigene Verfahren.- 4 Methode der Distanzberechnung.- 4.1 Definition der Spuren zwischen zwei Zeichenreihen.- 4.2 Definition der Distanz zwischen zwei Zeichenreihen.- 4.3 Wahl der reellen Konstanten c, e, w, u und d.- 4.4 Normale Spuren.- 4.5 Definition der rekursiven Funktion DM.- 4.6 Berechnung der Distanz durch DM.- 5 Praktische Durchführung.- 5.1 Techniken der Vorauswahl.- 5.2 Berechnung der Teilkosten-Matrix.- 6 Ergebnisse.- 7 Schätzung des Aufwands.- 8 Literaturverzeichnis.

Erscheint lt. Verlag 1.5.1980
Reihe/Serie Medizinische Informatik, Biometrie und Epidemiologie
Zusatzinfo X, 96 S.
Verlagsort Berlin
Sprache deutsch
Maße 170 x 244 mm
Gewicht 200 g
Themenwelt Mathematik / Informatik Mathematik Wahrscheinlichkeit / Kombinatorik
Studium Querschnittsbereiche Epidemiologie / Med. Biometrie
Schlagworte Algorithmen • Automatische Texterschliessung • Ergebnis • Fehler • Fischer • Klassifikation • Wissenschaftliches Manuskript
ISBN-10 3-540-09982-4 / 3540099824
ISBN-13 978-3-540-09982-6 / 9783540099826
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich
ein überfälliges Gespräch zu einer Pandemie, die nicht die letzte …

von Christian Drosten; Georg Mascolo

Buch | Hardcover (2024)
Ullstein Buchverlage
24,99

von Matthias Egger; Oliver Razum; Anita Rieder

Buch | Softcover (2021)
De Gruyter (Verlag)
59,95