Text Mining in den Sozialwissenschaften (eBook)
IX, 423 Seiten
Springer Fachmedien Wiesbaden GmbH (Verlag)
978-3-658-07224-7 (ISBN)
Die Analyse von Sprache ermöglicht Rückschlüsse auf Gesellschaft und Politik. Im Zeitalter digitaler Massenmedien liegt Sprache als maschinenlesbarer Text in einer Menge vor, die ohne Hilfsmittel nicht mehr angemessen zu bewältigen ist. Die maschinelle Auswertung von Textdaten kann in den Sozialwissenschaften, die Text bislang in der Regel qualitativ und weniger quantitativ, also sprachstatistisch, analysieren, wertvolle neue Erkenntnisse liefern. Vor diesem Hintergrund führt der Band in die Verwendung von Text Mining in den Sozialwissenschaften ein. Anhand exemplarischer Analysen eines Korpus von 3,5 Millionen Zeitungsartikeln zeigt er für konkrete Forschungsfragen, wie Text Mining angewandt werden kann.
Dr. Matthias Lemke ist wissenschaftlicher Mitarbeiter am Lehrstuhl für Politikwissenschaft, insbesondere Politische Theorie, der Helmut-Schmidt-Universität/Universität der Bundeswehr Hamburg.
Gregor Wiedemann ist wissenschaftlicher Mitarbeiter in der Abteilung Automatische Sprachverarbeitung der Universität Leipzig.
Dr. Matthias Lemke ist wissenschaftlicher Mitarbeiter am Lehrstuhl für Politikwissenschaft, insbesondere Politische Theorie, der Helmut-Schmidt-Universität/Universität der Bundeswehr Hamburg. Gregor Wiedemann ist wissenschaftlicher Mitarbeiter in der Abteilung Automatische Sprachverarbeitung der Universität Leipzig.
Vorwort 5
Inhalt 7
Einleitung Text Mining in den Sozialwissenschaften Grundlagen und Anwendungen zwischenqualitativer und quantitativer Diskursanalyse 10
1 Computergestützte Textanalysen zwischen Qualität und Quantität 10
2 Qualitative Sozialforschung trifft Text Mining 14
2.1 Das „ePol“-Projekt 14
2.2 Daten 16
2.3 Analyseinfrastruktur 17
3 Aufbau des Bandes 18
Literatur 22
Teil 1 Grundlagen 23
Blended Reading Theoretische und praktische Dimensionen derAnalyse von Text und sozialer Wirklichkeit imZeitalter der Digitalisierung 24
1 Textanalyse und sozialwissenschaftliche Erkenntnis 25
2 Text und soziale Wirklichkeit in hermeneutischer und wissenssoziologischer Perspektive vor und nach dem linguistic turn 28
2.1 Inkongruente Perspektiven: Distanzierungen der Wissenssoziologie 30
2.2 Perspektivische Konvergenz und theoretische Kompatibilität in vier Ansätzen: ‚Diskurs‘ und ‚Semantik‘ 38
3 Text und soziale Wirklichkeit im Zeitalter von Big Data 46
3.1 Das Dreiecksverhältnis von Interpret, Textdaten und Analyseverfahren 46
3.2 Blended reading als modularer Analyseprozess 50
4 Ein Weg zur Integration von Hermeneutik und Textstatistik im Zeitalter von Big Data 61
Literatur 63
Analyse qualitativer Daten mit dem „Leipzig Corpus Miner“ 69
1 Einleitung 70
2 Technische Infrastruktur 71
2.1 Komponenten 72
2.2 Computerlinguistische Vorverarbeitung 73
3 Analysekapazitäten 78
3.1 Dokument-Suche 79
3.2 Facettierte Suche 80
3.3 Frequenzanalyse 82
3.4 Kookkurrenzanalyse 82
3.5 Topic-Modelle 84
3.6 Term Extraktion/KWIC 85
3.7 Manuelle Annotation 86
3.8 Automatische Klassifi kation 87
4 Methodische Integration 89
4.1 Analyseworkflows 90
4.2 Ergebnisdarstellung 91
5 Zusammenfassung 92
Literatur 93
Methoden, Qualitätssicherung und Forschungsdesign Diskurs- und Inhaltsanalyse zwischenSozialwissenschaften und automatischerSprachverarbeitung 95
1 Das Potenzial von Text Mining für die computergestützte Inhaltsanalyse 96
2 Forschungsdesign und Methodenkombination 99
3 Analysestrategie und Qualitätssicherung 102
3.1 Quantitative Verfahren und Methoden 103
3.2 Qualitative Verfahren und Methoden 108
3.3 Deduktive und hypothesentestende Anwendungen 111
3.4 Induktive und explorative Anwendungen 116
4 Zusammenfassung 119
Literatur 120
Die Anwendung von Text Mining in den Sozialwissenschaften Ein Überblick zum aktuellen Stand der Methode 123
1 Text Mining in den Sozialwissenschaften – Eine Annäherung 124
2 Befunde zur Anwendung von Text Mining 125
2.1 Zur Tradition der Anwendung von Text Mining 126
2.2 Zeitgenössische Anwendungen von Text Mining 128
3 Optionen zur Kategorisierung 133
3.1 Fachlicher Bezug in den Sozialwissenschaften 133
3.2 Komplexität der angewandten Verfahren 135
3.3 Charakter existenter Publikationen 136
4 Fazit und Ausblick 137
4.1 Fazit 137
4.2 Ausblick 138
Literatur & Onlinepräsenzen
Teil 2 Fallstudien 143
Der Folterdiskurs in den deutschen Printmedien 144
1 Einleitung 145
2 Der Folterbegriff im medialen Diskurs 147
2.1 Quantitative Veränderungen 147
2.2 Kookkurrenzen 149
2.3 Peaks und ihre Relevanz 152
2.5 Wortschöpfungen in der Folterdebatte 163
3 Schlussbetrachtung 167
Literatur 169
Verwendete Zeitungsartikel 169
Sicherheit und Freiheit Mediale Wert-Diskurse im Angesicht terroristischerBedrohung 172
1 Sicherheit und Freiheit – Eine Werte-Diskussion 173
2 Methodik und Analyseprobleme 176
3 Frequenzanalyse 178
3.1 Terrorismus als Bedrohung für die deutsche Gesellschaft? 179
3.2 Die Prävention: Ein Kampf für Freiheit und Sicherheit? 183
3.3 Zwischenfazit 184
4 Die Beziehung von Freiheit und Sicherheit – Kookkurrenzanalyse 184
4.1 Sicherheit und Freiheit vor dem 11. September 185
4.2 9/11 als Wendepunkt? 189
4.3 Zwischenfazit 194
4.4 Sicherheit und Freiheit bis 2012 194
5 Synthese der Analyseergebnisse 197
Literatur 198
Verwendete Zeitungsartikel 198
Tolerant, liberal, populistisch? Eine digitale Analyse des Niederlandebildes inbundesdeutschen Tageszeitungen im Wandelder Zeit 200
1 Einleitung 201
1.1 Neue Fragen 203
1.2 Methode 204
1.3 Die ‚digitale Wende‘ in der Geschichtsschreibung 206
2 Die Niederlande als Partner 209
2.1 Einleitung 209
2.2 Suchanfrage ‚Niederlande‘ 210
2.3 Themen und Rubriken 211
2.4 Niederlande oder Benelux? 214
3 Die Niederlande als Vorbild (gidsland) 215
3.1 Einleitung 215
3.2 Zeitverlauf des ‚Modell Niederlande‘ 217
3.3 Assoziationen zum ‚Modell Niederlande‘ 219
3.4 Ende des ‚Modell Niederlande‘: Populismus 224
3 Fazit 228
Literatur 229
Ungleichheitsdeutungen im medialen Bildungsdiskurs Eine Analyse des PISA-Diskurses in Deutschland 232
1 Akzeptanz von sozialer Ungleichheit 233
2 Bildungsungleichheiten im Schulsystem und die Rolle der öffentlichen Medien 235
3 Methodisches Vorgehen 236
3.1 Auswahl des Untersuchungsgegenstandes 236
3.2 Festlegungen der Untersuchungszeiträume 237
3.3 Auswahl der Untersuchungsmethode 238
4 Analyse des politischen Bildungsdiskurses zu PISA 240
5 Deutungsmuster von sozialer Ungleichheit im PISA-Diskurs 254
6 Schlussfolgerungen: Welche Folgen haben die in den Zeitungen aufgegriffenen Deutungsmuster von sozialen Bildungsungleichheiten 256
Literatur 257
Verwendete Zeitungsartikel 259
Verwissenschaftlichung der Politik? Eine Analyse massenmedialer Darstellungskontextepolitischen Entscheidens (1946–2011) 261
1 Einleitung: Postdemokratische Wissensgesellschaft? 262
2 Diskussionen um die „Wissensgesellschaft“ 263
2.1 Ansätze einer akademischen Verwissenschaftlichung 265
2.2 Die zunehmende Bedeutung von Expertise und Beratung 265
2.3 Der Aufstieg quantifizierten und präzisen Wissens 266
3 Daten und Methode 267
3.1 Die Konstruktion des Analyse- und Quellkorpus 267
3.2 Die Konstruktion der Suchstrings 268
3.3 Die Analyse wissenschaftlicher Verweise und die Auswahl der Fallstudien 268
4 Analyse 269
4.1 Die drei Dimensionen der Verwissenschaftlichung 269
4.2 Verwissenschaftlichung politischer Entscheidungen zwischen 1946–2011 271
4.3 Die Fallstudien 274
5 Diskussion und Zusammenfassung 280
Literatur 283
7 Anhang 284
7.1 Suchstrings 284
7.2 Dimensionen verwissenschaftlichter Darstellung 285
7.3 Abbildungen 3–11 286
Internationale Organisationen in der deutschen Öffentlichkeit Ein Text Mining-Ansatz 293
1 Einführung 294
2 Die Politisierung internationaler Organisationen 296
3 Empirische Strategie 300
4 Die Sichtbarkeit internationaler Organisationen in der deutschen Presse 304
5 NRO in deutschen Pressediskursen über internationale Organisationen 310
6 Zusammenfassung und Diskussion 315
Literatur 316
Netzpolitik in statu nascendi Eine Annäherung an Wegmarken derPolitikfeldgenese 319
1 Netzpolitik als entstehendes Politikfeld 320
2 Feldtheorie und Bedingungen entstehender Politikfelder 321
3 Herangehensweise an die empirische Analyse 326
4 ‚Netzpolitische‘ Kerngegenstände 329
4.1 Kernthemen des politischen Diskurses um das Internet 330
4.2 Zwiebelmodell „netzpolitischer“ Themen 333
5 „Netzpolitik“ als feldbezeichnender Begriff 334
5.1 Formierung des Begriffes 335
5.2 Der Zusammenhang zwischen den Kernthemen und dem Begriff ‚Netzpolitik‘ 338
6 Zusammenfassender Befund 340
Literatur 342
Anhang: Politisierungsgrad der 27 vorselektierten Themen 345
Die Rückkehr der Religion in die politische Öff entlichkeit? Eine computerlinguistische Exploration derdeutschen Presse von 1946 –2012 347
1 Eine postsäkulare Wende im Westen? 348
2 Die Rückkehr der Religion in die politische Öffentlichkeit 350
3 Die Präsenz der Religion in der deutschen Presse 353
3.1 Wordcounts zu Religionsbegriff en – einen Überblick über das Textmaterial gewinnen 354
3.2 Topic-Modelle – Die Thematisierung von Religion im Kontext 358
3.3 Inhaltsanalyse und Machine Learning – Diskurse über Religion 362
4 Fazit 368
Literatur 370
Die drei Welten des Gerechtigkeitsjournalismus? Text Mining in FAZ, taz und SZ zu sozialerGerechtigkeit und Ungleichheit 372
1 Einleitung 373
2 Fragestellung und Literaturüberblick 374
3 Daten und Methoden 376
4 Analyse 378
4.1 Frequenzanalysen der drei Themenbereiche sozialer Gerechtigkeit und Ungleichheit 378
4.2 Kookkurrenzen zur Identifizierung von Themenkontexten 385
5 Fazit 393
Literatur 395
Teil 3 Fazit und Ausblick 397
Text Mining für die Analyse qualitativer Daten Auf dem Weg zu einer Best Practice? 398
1 Methoden und Analysestrategien im Überblick 400
2 Auswertung, Visualisierung und Dokumentation 404
3 Ein Metaframework für komplexe Analyseworkflows 408
4 Methodologische Anschlussfähigkeit 414
5 Ausblick 417
Literatur 419
Autorinnen und Autoren 421
Erscheint lt. Verlag | 28.10.2015 |
---|---|
Zusatzinfo | IX, 423 S. 80 Abb., 59 Abb. in Farbe. |
Verlagsort | Wiesbaden |
Sprache | deutsch |
Themenwelt | Sozialwissenschaften ► Politik / Verwaltung |
Sozialwissenschaften ► Soziologie ► Empirische Sozialforschung | |
Schlagworte | Diskursanalyse • Korpusanalyse • Methodik • Politikwissenschaft • Text Mining |
ISBN-10 | 3-658-07224-5 / 3658072245 |
ISBN-13 | 978-3-658-07224-7 / 9783658072247 |
Haben Sie eine Frage zum Produkt? |
Größe: 8,4 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich