Statistische Datenanalyse im Journalismus (eBook)
XVI, 319 Seiten
Springer Berlin Heidelberg (Verlag)
978-3-662-64693-9 (ISBN)
Ziel ist es, die Qualität und Aussagekraft datenjournalistischer Arbeiten zu verbessern, welche, neben der angemessenen Erfassung und Aufbereitung von Daten, wesentlich von einer adäquaten Datenanalyse abhängen. Aber wie statistisch arbeiten Datenjournalist:innen heute eigentlich? Und wie statistisch können oder sollten sie arbeiten, um den Ansprüchen ihrer Leserschaft in Sachen Verständlichkeit gerecht zu werden, auch mit Blick auf deren unterschiedliches mathematisch-statisches Vorwissen? Das Buch zielt darauf ab, diese Fragen zu beantworten, indem es weiterführende statistische Methoden anhand von Fallstudien untersucht. Es verdeutlicht, warum diese Methoden auch im journalistischen Kontext oftmals problemangemessener sind und tiefer gehende Erkenntnisse liefern als vereinfachte Analysen und Basismethoden. Die Fallstudien decken dabei die wichtigsten statistischen Methoden ab: Verteilungen und Tests, Klassifikation, Regression, Zeitreihenanalyse, Clusteranalyse, Analyse von sequentiellen Daten ohne direkten Zeitbezug, Verwendung von Vorwissen und geplante Studien.
Claus Weihs ist emeritierter Professor für Computergestützte Statistik an der TU Dortmund. Seine besondere Expertise liegt im Bereich Klassifikationsverfahren und ihren vielfältigen Anwendungen. Er hat langjährige Erfahrungen in der Zusammenarbeit mit Journalist:innen, sowohl in Lehrveranstaltungen als auch in Datenanalysen.
Vorwort 5
Danksagung 6
Inhaltsverzeichnis 7
Autoren 12
Notation 14
Teil IEinführung, Konzept und Grundlagen 15
Kapitel 1Einführung 16
1.1 Motivation 16
1.2 Daten und Studientypen 17
1.3 Modelle und ihre Beurteilung 19
1.4 Inhalt 20
Literaturverzeichnis 21
Kapitel 2 CRISP-DM - Ein Konzept für die journalistischeDatenanalyse? 22
2.1 Motivation und Methodik 22
2.2 Begriffsbildung 23
2.2.1 Datenjournalismus 23
2.2.2 Data Mining und KDD 24
2.2.3 Qualität im Datenjournalismus 25
2.3 Beschreibung der Arbeitsabläufe 26
2.3.1 Data-Mining-Prozess CRISP-DM 26
2.3.2 Typische datenjournalistische Arbeitsschritte 29
2.4 Wie ähnlich sind datenjournalistischer Arbeitsprozess undCRISP-DM? 31
2.4.1 Interviews als Informationsgrundlage 32
2.4.2 Die Ergebnisse 33
2.5 Kann CRISP-DM eine sinnvolle Leitlinie für denDatenjournalismus sein? 37
2.6 Zusammenfassung und Fazit 39
2.7 Diskussion 40
Literaturverzeichnis 40
Kapitel 3 Data Literacy 42
3.1 Einleitung 42
3.2 Was ist Data Literacy? 44
3.3 Wertschöpfung aus Daten 46
3.4 Daten und Unsicherheit 47
3.5 Operationalisierung: das DaCoNet-Konzept 51
3.6 Fazit: Data Literacy ist ein Prozess! 52
3.7 Diskussion 53
Literaturverzeichnis 53
Kapitel 4Datengrafiken zwischen Nutzwert und Design 56
4.1 Wozu wir Grafiken benötigen 56
4.2 Grafiken nutzerzentriert denken und entwickeln 57
4.3 Inhaltliche Qualität 59
4.4 Hochwertige Gestaltung 63
4.5 Angemessener Kontext 65
4.6 Diskussion 67
Literaturverzeichnis 67
Kapitel 5 Algorithmen im Fokus 69
5.1 Einführung 69
5.2 Recherchen zu Algorithmen 70
5.3 Wie Algorithmen arbeiten und dazulernen 71
5.4 Die zentralen Fragen an Algorithmen 72
5.5 Diskussion 75
Literaturverzeichnis 76
Teil IIFallstudien 78
Kapitel 6(Bedingte) Verteilung und statistische Tests 79
6.1 Fallstudie 1: Altersstruktur von Parlamenten 79
6.2 Re-Analyse 80
6.3 Zusammenfassung 88
6.4 Diskussion 89
Literaturverzeichnis 89
Kapitel 7Zusammenhangsanalyse: Klassifikation 90
7.1 Fallstudie 2: Abschneiden der AfD bei der Bundestagswahl2017 90
7.2 Re-Analyse 91
7.3 Zusammenfassung 99
7.4 Diskussion 100
Literaturverzeichnis 100
Kapitel 8Zusammenhangsanalyse: Regression 101
8.1 Fallstudie 3: Wählerstruktur bei der Bundestagswahl 2017 101
8.2 Die Analyse von Zeit Online 102
8.3 Re-Analyse 108
8.4 Vergleich und Diskussion 113
8.5 Zusammenfassung 114
8.6 Diskussion 114
Kapitel 9 Zeitreihenanalyse: Modellentwicklung über die Zeit 116
9.1 Fallstudie 4: Corona (COVID-19) Pandemie 116
9.2 Generelles Vorgehen 117
9.3 Gesamtanzahl Infizierter: Obergrenze und Stagnation 121
9.4 Anzahl Neuinfizierte 127
9.5 Reproduktionszahl 133
9.6 Zusammenfassung und Schlussfolgerung 138
9.7 Nachher weiß man immer alles besser? 139
9.8 Kommentar von Marie-Louise Timcke:Das Corona-Datenchaos: „Netflix & Bug fixing“
Literaturverzeichnis 143
Kapitel 10Gruppenbildung: Clusteranalyse 144
10.1 Fallstudie 5: Buchbestsellerlisten 144
10.2 Generelles Vorgehen 145
10.3 Analyse von Hardcover Belletristik 148
10.3.1 Längste und beste Karrieren 148
10.3.2 Glättung 149
10.3.3 Clusterbildung 150
10.3.4 Interpretation der Cluster 150
10.3.5 Einordnung von Buchtiteln in Cluster 154
10.4 Analyse von Hardcover Sachbuch 156
10.4.1 Längste und beste Karrieren 156
10.4.2 Glättung 157
10.4.3 Clusterbildung 158
10.4.4 Interpretation der Cluster 158
10.4.5 Einordnung von Buchtiteln in Cluster 161
10.5 Vergleich von Belletristik und Sachbuch 162
10.6 Diskussion 164
Kapitel 11 Sequentielle Daten: Analyse vonRadverkehrsnetzen 167
11.1 Fallstudie 6: Radwege in Berlin 167
11.2 GPS-Koordinaten 168
11.3 Nutzung des Radnetzes 173
11.4 Identifikation der Lücken im Radnetz 176
11.5 Zusammenfassung 179
11.6 Kommentar von Hendrik Lehmann 179
Literaturverzeichnis 181
Kapitel 12Datenerhebung: Verwendung von Vorwissen 182
12.1 Datenerhebung 182
12.2 Verwendung von Vorwissen 183
12.3 Fallstudie 7: Professorenumfrage 184
12.4 Die E-Mail-Umfrage 184
12.4.1 Gesamtarbeitszeit 185
12.4.2 Summe von Teilarbeitszeiten 185
12.4.3 Ausschluss-Kriterien 187
12.5 Statistische Methoden 189
12.5.1 Prognoseintervalle frequentistisch 189
12.5.2 Relevantes Vorwissen 190
12.5.3 A-priori Verteilungen 192
12.5.4 A-posteriori Verteilungen 193
12.5.5 Prognoseintervalle Bayesianisch 193
12.5.6 Empirische Bayes-Methode am Beispiel 194
12.6 Ergebnisse 196
12.6.1 Gesamtschätzung der wöchentlichen Arbeitszeit 196
12.6.2 Summierter wöchentlicher Zeitaufwand 197
12.7 Weitere Ergebnisse 199
12.8 Zusammenfassung 199
12.9 Kommentar von Holger Wormer 200
Literaturverzeichnis 201
Kapitel 13Geplante Studien 202
13.1 Motivation und Zielsetzung 202
13.2 Geplante Studien in der Wirtschaftsjournalistik:Wirkungunterschiedlicher Medien 202
13.3 Statistische Versuchsplanung 204
13.4 Fallstudie 8: Art der Präsentation 207
13.5 Diskussion 211
Literaturverzeichnis 212
Teil IIIQualitätsstandards 213
Kapitel 14Datenethik im Journalismus 214
14.1 Berührungspunkte von Datenethik, Datenwissenschaftenund Journalismus 214
14.2 Die Sonderrolle von Zahlen und Fakten 216
14.3 Für datenbezogenen Journalismus relevante Ziffern desPressekodex 217
14.4 Fazit 225
14.4 Fazit 225
14.5 Diskussion 225
Literaturverzeichnis 226
Kapitel 15Qualitätsstandards: Checklisten als Hilfsmittel 228
15.1 Einleitung: Studien und Experten - eine Wissenschaft fürsich? 228
15.2 Nicht nur für Investigativjournalisten: Arbeitstechnikender strukturierten journalistischen Recherche 229
15.3 Experten-Checkliste: Wenn man Daten nicht bewertenkann, dann wenigstens den Datenproduzenten 231
15.4 Studien-Checkliste: Daten und Publikationen nachformalen Kriterien prüfen 235
15.5 Fazit: Was Journalisten und was Datenjournalisten vonDaten, Studien undWissenschaft mindestens wissen sollten 240
15.6 Diskussion 241
Literaturverzeichnis 243
Anhang ADaten und R-Programme 245
A.6 Kapitel 6: Fallstudie 1: Altersstruktur von Parlamenten 246
A.6.1 Daten 246
A.6.2 R-Programm 248
A.7 Kapitel 7: Fallstudie 2: Abschneiden der AfD bei derBundestagswahl 2017 254
A.7.1 Daten 254
A.7.2 R-Programm 259
A.8 Kapitel 8: Fallstudie 3: Wählerstruktur bei derBundestagswahl 2017 261
A.8.1 Daten 261
A.8.2 R-Programm 262
A.9 Kapitel 9: Fallstudie 4: Corona (COVID-19) Pandemie 263
A.9.1 Daten 263
A.9.2 R-Programm 264
A.10 Kapitel 10: Fallstudie 5: Buchbestsellerlisten 270
A.10.1 Daten 270
A.10.2 R-Programm 288
A.11 Kapitel 11: Fallstudie 6: Radwege in Berlin 293
A.11.1 Daten 293
A.11.2 R-Programm 310
A.12 Kapitel 12: Fallstudie 7: Professorenumfrage 319
A.12.1 Daten 319
A.12.2 R-Programm 321
Sachverzeichnis 327
Erscheint lt. Verlag | 24.5.2022 |
---|---|
Zusatzinfo | XVI, 319 S. 74 Abb., 68 Abb. in Farbe. |
Sprache | deutsch |
Themenwelt | Geisteswissenschaften ► Sprach- / Literaturwissenschaft |
Mathematik / Informatik ► Mathematik ► Statistik | |
Sozialwissenschaften ► Kommunikation / Medien ► Journalistik | |
Sozialwissenschaften ► Kommunikation / Medien ► Kommunikationswissenschaft | |
Sozialwissenschaften ► Politik / Verwaltung | |
Schlagworte | CRISP-DM • Datenjournalistik • Journalistische Datenanalyse • Methodenkenntnisse im Datenjournalismus • Qualitätsstandards für datenjournalistische Analysen • Statistische Datenanalyse • Statistische Methoden des Datenjournalismus • Statistische Methodenkompetenz im Datenjournalismus • Wissenschaftsjournalismus |
ISBN-10 | 3-662-64693-5 / 3662646935 |
ISBN-13 | 978-3-662-64693-9 / 9783662646939 |
Informationen gemäß Produktsicherheitsverordnung (GPSR) | |
Haben Sie eine Frage zum Produkt? |
Größe: 7,5 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich