Syntactic n-grams in Computational Linguistics (eBook)
IX, 92 Seiten
Springer International Publishing (Verlag)
978-3-030-14771-6 (ISBN)
In this book, we propose and systematize the concept of syntactic n-grams, which allows using syntactic information within the automatic text processing methods related to classification or clustering. It is a very interesting example of application of linguistic information in the automatic (computational) methods. Roughly speaking, the suggestion is to follow syntactic trees and construct n-grams based on paths in these trees. There are several types of non-linear n-grams; future work should determine, which types of n-grams are more useful in which natural language processing (NLP) tasks.
This book is intended for specialists in the field of computational linguistics. However, we made an effort to explain in a clear manner how to use n-grams; we provide a large number of examples, and therefore we believe that the book is also useful for graduate students who already have some previous background in the field.
Grigori Sidorov is full Professor and researcher at the 'Centro de Investigación en Computación' (Center for Computing Research, CIC),which is part of the 'Instituto Politécnico Nacional' (National Polytechnic Institute), IPN in Mexico city, Mexico.
Grigori Sidorov is full Professor and researcher at the "Centro de Investigación en Computación" (Center for Computing Research, CIC),which is part of the "Instituto Politécnico Nacional" (National Polytechnic Institute), IPN in Mexico city, Mexico.
Preface.- Introduction.- PART I. VECTOR SPACE MODEL IN THE ANALYSIS OF SIMILARITY BETWEEN TEXTS.- Chapter 1. Formalization in computational linguistics.- Chapter 2. Vector space model.- Chapter 3. Vector space model for texts and the tf-idf measure.- Chapter 4. Latent Semantic Analysis (LSA): reduction of dimensions.- Chapter 5. Design of experiments in computational linguistics.- Chapter 6. Example of application of n-grams: authorship attribution using n-grams of syllables.- PART II. NON-LINEAR CONSTRUCTION OF N-GRAMS.- Chapter 7. Syntactic n-grams: the concept.- Chapter 8. Types of syntactic n-grams according to their components.- Chapter 9. Continuous and non-continuous syntactic n-grams.- Chapter 10. Metalanguage of syntactic n-grams representation.- Chapter 11. Examples of construction of non-continuous syntactic n-grams.- Chapter 12. Automatic analysis of authorship using syntactic n-grams.- Chapter 13. Filtered n-grams.- Chapter 14. Generalized n-grams.
Erscheint lt. Verlag | 2.4.2019 |
---|---|
Reihe/Serie | SpringerBriefs in Computer Science |
Zusatzinfo | IX, 92 p. 15 illus., 10 illus. in color. |
Verlagsort | Cham |
Sprache | englisch |
Themenwelt | Mathematik / Informatik ► Informatik |
Schlagworte | Computational Linguistics • Natural Language Processing • N-grams • textual similarity • vector space model |
ISBN-10 | 3-030-14771-1 / 3030147711 |
ISBN-13 | 978-3-030-14771-6 / 9783030147716 |
Haben Sie eine Frage zum Produkt? |
Größe: 2,3 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich