Handbuch der sozialwissenschaftlichen Datenanalyse (eBook)

Christof Wolf, Henning Best (Herausgeber)

eBook Download: PDF
2011 | 2010
1098 Seiten
VS Verlag für Sozialwissenschaften
978-3-531-92038-2 (ISBN)

Lese- und Medienproben

Handbuch der sozialwissenschaftlichen Datenanalyse -
Systemvoraussetzungen
129,99 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Das Handbuch der sozialwissenschaftlichen Datenanalyse bietet in über 40 Kapiteln eine umfassende Darstellung multivariater Analyseverfahren. Schwerpunkte des Handbuchs bilden Grundlagen der Datenanalyse, regressionsanalytische Verfahren für Quer- und Längsschnittsdaten sowie Skalierungsverfahren. Behandelt werden u. a. OLS-, logistische und robuste Regression, Strukturgleichungsmodelle, Mehrebenen-, Panel-, Ereignisdaten- und Zeitreihenanalyse, MDS und Rasch-Modelle. Darüber hinaus werden viele neuere Verfahren dargestellt, etwa multiple Imputation, Bootstrappen, Analyse latenter Klassen und propensity score matching.
Jedes Kapitel beginnt mit einer allgemein verständlichen Einführung. Es folgt eine Darstellung der mathematisch-statistischen Grundlagen. Anschließend wird jedes Verfahren anhand eines sozialwissenschaftlichen Beispiels vorgestellt. Die Beiträge enden mit Hinweisen auf typische Anwendungsfehler und einer kommentierten Literaturempfehlung.

Prof. Dr. Christof Wolf ist Wissenschaftlicher Leiter der Abteilung 'Dauerbeobachtung der Gesellschaft' der GESIS - Leibniz-Institut für Sozialwissenschaften und hat eine Professur für Sozialstrukturanalyse an der Universität Mannheim.

PD Dr. Henning Best ist wissenschaftlicher Mitarbeiter am Lehrstuhl für Methoden der empirischen Sozialforschung der Universität Mannheim.

Prof. Dr. Christof Wolf ist Wissenschaftlicher Leiter der Abteilung "Dauerbeobachtung der Gesellschaft" der GESIS – Leibniz-Institut für Sozialwissenschaften und hat eine Professur für Sozialstrukturanalyse an der Universität Mannheim. PD Dr. Henning Best ist wissenschaftlicher Mitarbeiter am Lehrstuhl für Methoden der empirischen Sozialforschung der Universität Mannheim.

Vorwort 5
Inhaltsverzeichnis 6
Teil I Einführung 10
1 Einführung: Sozialwissenschaftliche Datenanalyse 11
1 Moderne Sozialwissenschaft und die Bedeutung der Statistik 11
2 Ziele und Zielgruppe des Handbuchs 12
3 Themenauswahl 13
4 Gliederung und Inhal 14
5 Ausblick 14
Literaturverzeichnis 15
2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik 16
1 Einführung 16
2 Was heißt Kausalität? 17
2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität 18
2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen 18
2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität 18
2.4 Kausalität als „Mechanismus“ 19
2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn? 19
2.6 Exkurs: Die Logik der Erklärung 20
2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität 21
2.8 Zum Vergleich der Kausalitäts-Definitionen 23
3 Kausalität in sozialwissenschaftlichen Experimenten 24
4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression 27
4.1 Enthalten Kausalmodelle Kausalaussagen? 27
4.2 Regressionsanalyse und kausale Schlüsse 28
4.3 Kausalität in anderen multivariaten Verfahren 33
4.4 Gibt es Algorithmen für die Ermittlung von Kausalität? 34
5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen 36
6 Kausalität in Messmodellen 38
7 Resümee 41
8 Literaturempfehlungen 41
Literaturverzeichnis 42
Teil II Grundlagen der Datenanalyse 46
3 Datengewinnung und Datenaufbereitung 47
1 Daten 47
2 Formen der Datenerhebung 49
2.1 Befragung 49
Persönlich-Mündliches Interview 53
Schriftliche Befragung 54
Telefonbefragung 56
Onlinebefragungen 57
Entscheidung für eine Befragungsform 60
2.2 Beobachtung 61
3 Stichprobenziehung 63
4 Datenaufbereitung 66
4.1 Transkription 66
4.2 Kodierung 66
4.3 Plausibilisierung 67
4.4 Gewichtung 68
4.5 Archivierung 68
5 Literaturempfehlungen 69
Literaturverzeichnis 69
4 Uni- und bivariate deskriptive Statistik 71
1 Univariate Statistik 71
1.1 Lagemaße 71
Arithmetische Mittel 71
Median (Zentralwert) 72
Modalwert 74
1.2 Streuungsmaße 74
Varianz, Standardabweichung und Variationskoeffizient 75
Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung 77
Index qualitativer Variation 78
1.3 Schiefe 78
2 Bivariate Statistik 79
2.1 Tabellenanalyse 81
Spalten-, Zeilen- und Gesamtprozente 81
Prozentuierung und statistische Unabhängigkeit 82
Prozentsatzdifferenz 83
Odds und Odds-Ratio 84
Nominalskalierte Maße: Cramérs V 85
Ordinalskalierte Merkmale 87
2.2 Metrische Merkmale: Kovarianz und Korrelation 91
3 Ausblick 94
4 Literaturempfehlungen 94
Literaturverzeichnis 94
5 Graphische Datenexploration 96
1 Einführung 96
2 Graphische Methoden für die Datenexploration 98
2.1 Einteilungskriterien für graphische Darstellungen 98
2.2 Univariate Analysen 99
Untersuchung der empirischen Häufigkeitsverteilung 99
Vergleich von Verteilungen 108
Die Darstellung von Zeitreihen 112
2.3 Bivariate Analysen 113
Das Anscombe-Quartett 114
Streudiagramm 115
2.4 Multivariate Analysen 117
3 Fehlervermeidung und Hinweise zum praktischen Vorgehen 119
4 Literaturempfehlungen 120
Anhang 120
Literaturverzeichnis 121
6 Der Umgang mit fehlenden Werten 122
1 Einführung in Techniken zur Kompensation fehlender Werte 122
1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit 122
1.2 Gewichtung 125
Schätzung der Responsewahrscheinlichkeiten 126
Gewichten oder nicht? 127
Ergänzungen 128
1.3 Multiple Imputation 129
Voraussetzungen 129
Erzeugung multipler Imputationen 130
Auswertung multipel imputierter Datensätze 132
Ergänzungen 133
2 Mathematisch-statistische Grundlagen 134
2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit 134
2.2 Gewichtung 135
2.3 Multiple Imputation 137
3 Beispiel: Einkommensgleichung mit fehlenden Werten 140
4 Häufige Fehler 144
5 Literaturempfehlungen 146
Literaturverzeichnis 147
7 Gewichtung 148
1 Einführung in das Verfahren 148
2 Mathematisch-statistische Grundlagen 150
2.1 Designgewichtung in komplexen Stichprobenerhebungen 152
Schichtung 153
Proportionale Aufteilung 154
Disproportionale Schichtung 154
Klumpenauswahl 155
Auswahl mit ungleichen Wahrscheinlichkeiten 156
2.2 Kombination von Anpassungs- und Designgewichtung 158
3 Gewichtung am Beispiel des ESS 163
4 Häufige Fehler 168
5 Literaturempfehlungen 168
Literaturverzeichnis 168
8 Grundlagen des statistischen Schließens 170
1 Einführung in die Fragestellung 170
2 Statistisches Schätzen 171
2.1 Eigenschaften von Schätzern 172
2.2 Intervallschätzung 175
3 Statistisches Testen 179
3.1 Hypothesentests über Konfidenzintervalle 179
3.2 Signifikanztests 180
3.3 Berücksichtigung der Trennschärfe von Tests 183
3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests 185
4 Anwendungsfehler und Anwendungsprobleme 187
4.1 Fallzahlabhängigkeit 188
4.2 Spezifikation der statistischen Fragestellung 189
4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse 190
Interpretation von Konfidenzintervallen 190
Interpretation von Signifikanzen 190
Formulierung der Forschungshypothese als Alternativhypothese 191
Multiples Testen 191
Modell-Fitting 192
Stichprobenpläne als Quelle von Interpretationsfehlern 193
5 Literaturhinweise 193
Literaturverzeichnis 194
9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap 195
1 Einführung in das Verfahren 195
2 Mathematisch-statistische Grundlagen 199
2.1 Standardfehler und Konfidenzintervall von ˆ? 199
Normale Approximationsmethode 200
Perzentil-Methode 200
Bias-corrected and accelerated Methode (BCa) 200
2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten 202
3 Ein Beispiel 203
3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation 205
4 Häufige Fehler 206
5 Literaturempfehlungen 208
Literaturverzeichnis 208
10 Maximum-Likelihood Schätztheorie 209
1 Einführung in das Verfahren 210
2 Die Mechanik des Maximum-Likelihood Verfahrens 212
2.1 Das ML-Verfahren zur Bestimmung eines Parameters 213
2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter 218
3 Statistische Eigenschaften der ML-Schätzer 223
4 Inferenzstatistik und Modellanpassung 226
4.1 Test auf Signifikanz individueller Parameter 227
4.2 Test auf Signifikanz mehrerer Parameter 228
Likelihood Ratio Test 228
Wald-Test 229
Lagrange Multiplikatortest 230
4.3 Modellgüte 231
McFadden R2 232
Wald- und LM-basierte R2 233
AIC und BIC 234
5 Numerische Optimierungsverfahren 235
6 Literaturempfehlungen 237
Literaturverzeichnis 238
Teil III Messen und Skalieren 240
11 Reliabilität, Validität, Objektivität 241
1 Einführung 241
2 Objektivität 242
2.1 Durchführungsobjektivität 242
2.2 Auswertungsobjektivität 243
2.3 Interpretationsobjektivität 244
3 Reliabilität 244
3.1 Retest-Reliabilität 246
Beispiel zur Bestimmung der Retest-Reliabilität 247
3.2 Die Paralleltest-Reliabilität 247
3.3 Die Split-Half-Reliabilität 248
Beispiel zur Bestimmung der Split-Half-Reliabilität 249
3.4 Konsistenzanalysen 250
Beispiel zur Bestimmung der internen Konsistenz 250
3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten 251
4 Validität 252
4.1 Die Inhaltsvalidität 252
4.2 Kriteriumsvalidität 253
4.3 Konstruktvalidität 255
Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität) 255
Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten 256
Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil 257
5 Vorgehen zur Güteüberprüfung von Skalen 258
6 Häufige Fehler 259
7 Literaturempfehlungen 259
Literaturverzeichnis 260
12 Thurstone- und Likertskalierung 261
1 Einleitung 261
2 Thurstone Skalierung 262
2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ) 262
Grundlagen des Verfahrens 262
Vorgehensweise bei der Skalierung 264
Anwendungsbeispiel 266
2.2 Die Methode der gleich erscheinenden Intervalle 270
2.3 Die Methode der sukzessiven Intervalle (MSI) 272
Grundlagen des Verfahrens 272
Anwendungsbeispiel 273
2.4 Häufige Fehler bei der Thurstone Skalierung 277
3 Likertskalierung 277
3.1 Grundlagen des Verfahrens 277
3.2 Anwendungsbeispiel 279
3.3 Häufige Fehler bei der Likert Skalierung 282
4 Literaturempfehlungen 282
Literaturverzeichnis 282
13 Guttman- und Mokkenskalierung 284
1 Einleitung 284
2 Guttmanskalierung 286
2.1 Grundlagen des Verfahrens 286
Modellannahmen 288
Schätzung von Item- und Personenparametern 289
Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern 290
Modellprüfung 291
2.2 Anwendungsbeispiel 297
2.3 Häufige Fehler bei der Guttmanskalierung 299
3 Mokkenskalierung 300
3.1 Grundlagen des Verfahrens 300
Modellprüfung 302
3.2 Anwendungsbeispiel 306
3.3 Häufige Fehler bei der Mokkenskalierung 308
4 Literaturempfehlungen 308
Literaturverzeichnis 309
14 Item-Response-Theorie 311
1 Einführung 312
2 Modelle für dichotome Items 313
2.1 Das Rasch-Modell 313
2.2 Das Birnbaum-Modell 316
2.3 Das Modell mit Rateparameter 317
3 Modelle für mehrstufig geordnete Items 318
3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell) 318
3.2 Weitere IRT-Modelle für ordinale Items 320
4 Weitere IRT-Modelle 321
4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell 321
5 Modelltestung und Modellvergleiche 322
6 Beispielanwendung 324
6.1 Anwendung 1: Kompetenzmessung 324
6.2 Anwendung 2: Surveyforschung 326
7 Häufige Fehler 330
8 Literaturempfehlungen 331
Literaturverzeichnis 331
15 Hauptkomponentenanalyse und explorative Faktorenanalyse 333
1 Einführung in das Verfahren 333
1.1 Einsatzmöglichkeiten 333
1.2 Die Hauptkomponentenanalyse 336
Eine geometrische Perspektive 336
Die konkreten Schritte der PCA 340
Bestimmung der Komponentenzahl 341
Die unrotierte Lösung 343
Rotation 344
Berechnung von Komponentenwerten 347
1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne 348
2 Mathematisch-statistische Grundlagen 350
3 Ein Anwendungsbeispiel: Vertrauen in Institutionen 354
4 Probleme und Erweiterungen 360
5 Literaturempfehlungen 363
Anhang 364
Literaturverzeichnis 364
16 Korrespondenzanalyse 366
1 Einleitung 366
2 Mathematisch-statistische Grundlagen 368
3 Ein Beispiel 370
3.1 Graphische Darstellung 370
3.2 Numerische Darstellung 373
4 Erweiterungen der Korrespondenzanalyse 376
4.1 Zusammengesetzte Tabellen 376
4.2 Multiple Korrespondenzanalyse 378
4.3 Aktive und passive Merkmale 382
4.4 Andere Datenformate 384
5 Häufige Fehler 385
6 Diskussion 386
7 Literaturempfehlungen 386
Literaturverzeichnis 387
17 Multidimensionale Skalierung 389
1 Einführung in die MDS 389
1.1 Die MDS als psychologisches Modell 390
1.2 Die MDS zur Exploration von Datenstrukturen 392
2 Mathematische Grundlagen der MDS 393
2.1 Güte einer MDS-Lösung 393
2.2 Bewertung des Stress 395
2.3 MDS-Modelle 397
2.4 MDS-Algorithmen 400
2.5 Konfirmatorische MDS 400
3 Häufige Fehler 403
3.1 Degenerierte Lösungen in der ordinalen MDS 403
3.2 Falsche Polung der Proximitäten 405
3.3 Fehlbewertung von Stress 406
3.4 Fehler beim Vergleich verschiedener MDS-Lösungen 407
3.5 Mechanische Interpretation „der“ Dimensionen 409
3.6 Behandlung störender Punkte 412
3.7 Überinterpretation von Dimensionsgewichten 413
4 Literaturempfehlungen 413
Anhang 414
Literaturverzeichnis 415
Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen 417
18 Analyse kategorialer Daten 418
1 Einführung in das Verfahren 418
2 Mathematisch-statistische Grundlagen 430
3 Ein Beispiel 440
4 Häufige Fehler 448
5 Literaturempfehlungen 450
Literaturverzeichnis 450
19 Varianz- und Kovarianzanalyse 452
1 Einführung in das Verfahren 452
1.1 Vergleich von zwei Gruppen 454
Modellgleichung 455
Hypothesen 455
Quadratsummen 456
Freiheitsgrade 457
Allgemeine Teststatistik 457
Annahmen 459
Exkurs: Mittlere Quadratsummen 460
1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse 461
1.3 Mehrfaktorielle Varianzanalyse 462
Modellgleichung 462
Hypothesen 463
Quadratsummen 463
Freiheitsgrade 464
Teststatistik 465
Annahmen 465
1.4 Kovarianzanalyse 466
Modellgleichung 467
ANOVA versus ANCOVA 467
1.5 Effektstärke 468
1.6 Teststärke 471
2 Mathematisch-statistische Grundlagen 472
2.1 ANOVA und ANCOVA als Spezialfälle des ALM 473
2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM 477
3 Ein Beispiel 480
3.1 Vergleich von zwei Gruppen 480
3.2 Vergleich von mehr als zwei Gruppen 481
3.3 Mehrfaktorielle ANOVA 482
3.4 Kovarianzanalyse 484
3.5 Annahmen der Varianz- und Kovarianzanalyse 484
3.6 Teststärke 488
4 Häufige Fehler – eine Checkliste 488
5 Literaturempfehlungen 489
Literaturverzeichnis 489
20 Diskriminanzanalyse 491
1 Einführung in das Verfahren 491
1.1 Zielsetzung und Anwendungsmöglichkeiten 491
1.2 Problemstellung und Prämissen 493
1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren 495
1.4 Vorgehensweise 497
Festlegung des Untersuchungsdesigns 497
Extraktion der Diskriminanzfunktion(en) 498
Evaluation der Diskriminanzfunktion(en) 500
Merkmalsselektion und Klassifikation neuer Objekte 502
2 Mathematisch-statistische Grundlagen 503
2.1 Ermittlung der Diskriminanzfunktion (en) 503
2.2 Prüfkriterien der Diskriminanz 507
2.3 Klassifikationskonzepte 508
Distanzkonzept 509
Wahrscheinlichkeitskonzept 510
Konzept der Klassifikationsfunktionen nach Fisher 510
3 Anwendungsbeispiel 511
4 Häufige Fehler 515
5 Literaturempfehlungen 517
Literaturverzeichnis 518
21 Clusteranalyse 520
1 Einführung in das Verfahren 520
1.1 Was ist Clusteranalyse und was sind überhaupt Cluster? 521
1.2 Clusterstruktur 522
1.3 Algorithmen 522
1.4 Variablenräume 523
1.5 Agglomerative Verfahren 524
Ähnlichkeitsmaß, Distanz und Index 524
Fusionswerte und Dendrogramme 525
1.6 Wahl der Metriken und Agglomerationsverfahren 526
1.7 K-Means (Clusterzentrenanalyse) 527
1.8 TwoStep-Clusteranalyse 529
2 Mathematisch-statistische Grundlagen 530
2.1 Hierarchisch-agglomerative Verfahren 530
Ähnlichkeitsmaße und Distanzen 530
Gewichtung und Standardisierung von Variablen 532
Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten 532
Dendrogramm und Ultrametrik 533
2.2 K-Means 534
2.3 TwoStep-Verfahren 534
Die beiden Stufen der Clusterung 534
Anzahl der Cluster 535
Tabellen und Graphiken zur Beschreibung der Cluster 536
3 Beispiel 536
3.1 Daten- und Variablenauswahl 536
3.2 Analyse 537
3.3 Verbesserung der Clusterlösung 540
Variablenauswahl 540
Eliminieren von „Ausreißern“ 540
Optimierung der Lösung durch eine K-Means-Analyse 541
3.4 Überprüfen der Clusterlösung 542
3.5 TwoStep-Clusteranalyse 543
4 Häufige Fehler 545
5 Literaturempfehlungen 546
Literaturverzeichnis 547
22 Analyse latenter Klassen 548
1 Einführung in das Verfahren 548
2 Mathematisch-statistische Grundlagen 550
2.1 Modellansatz 550
2.2 Parameterschätzung 551
2.3 Computerprogramme 553
3 Ein Beispiel 555
3.1 Daten 555
3.2 Zahl der latenten Klassen 555
3.3 Lokale Unabhängigkeit 559
3.4 Inhaltliche Interpretierbarkeit 560
3.5 Stabilität 562
3.6 Formale Validitätsprüfung durch Validitätsindizes 564
3.7 Kriterienbezogene Validitätsprüfung 564
4 Häufige Fehler 566
5 Alternativen 567
6 Literaturempfehlungen 568
Literaturverzeichnis 569
23 Netzwerkanalyse 570
1 Einführung 570
2 Darstellung der Verfahren 575
2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden 576
Dyaden 577
Triaden 578
Triadische Umgebungen einzelner Knoten 579
2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung 582
2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten 586
Cliquen und Clans 587
k-Plexe und k-Cores 588
Zusammenhangs-Komponenten 588
Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen 589
3 Ein Beispiel 589
3.1 Daten 589
3.2 Zielsetzungen 591
3.3 Erstellung des Datensatzes 592
4 Literaturempfehlungen 596
Literaturverzeichnis 597
Teil V Regressionsverfahren für Querschnittsdaten 599
24 Lineare Regressionsanalyse 600
1 Einführung 600
2 Mathematisch-statistische Grundlagen 605
2.1 Das allgemeine Modell 605
2.2 Die Identifikation der Regressionskoeffizienten 606
2.3 Annahmen der Kleinst-Quadrat-Methode 608
2.4 Die Bestimmung der Modellgüte 610
2.5 Die statistische Absicherung der Regressionsergebnisse 612
2.6 Die Interpretation der Regressionskoeffizienten 616
2.7 Standardisierte Regressionskoeffizienten und ihre Probleme 618
3 Ein Beispiel 621
3.1 Zur Operationalisierung 621
3.2 Ergebnisse 622
4 Häufige Fehler 628
5 Literaturhinweise 630
Literaturverzeichnis 630
25 Lineare Regression: Modellannahmen und Regressionsdiagnostik 632
1 Einführung 632
1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen 633
1.2 Regressionsdiagnostik: ein erster Einblick 635
2 Mathematisch-statistische Grundlagen 638
2.1 Annahmen der linearen Regressionsanalyse 638
2.2 Grundlagen und Instrumente der Regressionsdiagnostik 645
Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik 645
Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells 646
Diagnostik zu potenziell einflussreichen Untersuchungseinheiten 652
3 Regressionsdiagnostik am Beispiel 655
3.1 Datengrundlage und Regressionsmodell 655
3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel 656
3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel 661
4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen 665
5 Literaturempfehlungen 666
Anhang 667
Literaturverzeichnis 667
26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines 669
1 Einführung 669
2 Interaktionseffekte, Polynome und Splines 670
2.1 Nicht-Additivität: Interaktionseffekte 670
2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation 673
2.3 Nicht-Linearität: Polynome und Splines 674
2.4 Polynome 675
2.5 Splines 677
3 Tests auf Gruppenunterschiede und Nicht-Linearität 681
4 Anwendungsbeispiel I: Interaktionseffekte 683
5 Anwendungsbeispiel II: Polynome und Slopes 689
6 Häufige Fehler 696
7 Literaturempfehlungen 697
Literaturverzeichnis 697
27 Robuste Regression 699
1 Einführung in das Verfahren 699
2 Mathematisch-statistische Grundlagen 709
2.1 Der Kleinste-Quadrate-Schätzer 709
2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer 710
Erwartungstreue, Konsistenz und Effizienz 710
Relative Effizienz 711
Einfluss-Funktion, Bruchpunkt und maximale Verzerrung 712
Zusammenfassung 713
2.3 M-Schätzer 713
Berechnung von M-Schätzern 717
Bruchpunkt von M-Schätzern 719
Bounded-Influence-Schätzer 719
2.4 High-Breakdown-Schätzer 720
LMS- und LTS-Schätzer 720
S-Schätzer 721
MM-Schätzer 722
3 Ein Beispiel 723
4 Literaturempfehlungen 729
Literaturverzeichnis 730
28 Mehrebenenanalyse mit Querschnittsdaten 733
1 Einführung in das Verfahren 733
2 Mathematisch-statistische Grundlagen 741
2.1 Die Modellklassen der Mehrebenenanalyse 743
Das Random-Intercept-Only-Modell (R-I-O-M) 743
Das Random-Intercept-Modell (R-I-M) 744
Random-Intercept-Random-Slope-Modell (R-I-R-S-M) 744
Das Intercept-as-Outcome-Modell (I-as-O-M) 745
Das Random-Coefficient-Modell (R-C-M) 746
2.2 Beurteilung der Anpassung des Mehrebenenmodells 747
2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation 749
Grand-Mean-Zentrierung 749
Group-Mean-Zentrierung 750
2.4 Standardisierung der kontextspezifischen und Populationsschätzer 752
2.5 Besonderheiten des Erhebungsdesigns 754
3 Ein Beispiel – Die deutsche PISA 2006 Studie 755
4 Häufige Fehler 763
5 Literaturempfehlungen 764
Literaturverzeichnis 765
29 Strukturgleichungsmodelle 767
1 Einführung in das Verfahren 767
1.1 Ausgangspunkt: Regressions- und Pfadmodell 768
1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen 769
1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle 771
1.4 Das allgemeine Strukturgleichungsmodell 773
Modellevaluation 775
Modellvergleich 776
Modellsparsamkeit 777
1.5 Spezielle Modellvarianten 778
Modelle für mehrere Gruppen (Multiple Gruppenvergleiche) 778
Längsschnittmodelle 778
Modelle mit Interaktionstermen 778
Die Behandlung fehlender Werte 779
2 Mathematisch-statistische Grundlagen 779
2.1 Ableitung der Elemente der Kovarianzmatrix ? 779
2.2 Schätzung der Parameter 780
3 Ein Beispiel 783
3.1 Messung der latenten Konstrukte 785
3.2 Messmodell der latenten endogenen Variablen 785
3.3 Messmodell der latenten exogenen Variablen 785
3.4 Überprüfung der Messmodelle 786
3.5 Intervenierende Variablen 788
3.6 Strukturgleichungsmodell 788
4 Häufige Fehler 790
5 Literaturempfehlungen 792
Anhang 793
Literaturverzeichnis 794
30 Regression mit unbekannten Subpopulationen 797
1 Einführung in das Verfahren 797
2 Mathematisch-statistische Grundlagen 799
2.1 Spezifikation 800
2.2 Schätzung 805
2.3 Test auf die Anzahl der Komponenten 807
2.4 Anpassungsindizes 808
3 Ein Beispiel 808
4 Häufige Fehler 816
5 Literaturempfehlungen 816
Literaturverzeichnis 817
31 Logistische Regression 818
1 Einführung in das Verfahren 818
1.1 Das lineare Wahrscheinlichkeitsmodell 819
1.2 Die logistische Regression 820
1.3 Interpretation der Koeffizienten 822
2 Mathematisch-statistische Grundlagen 825
2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable 825
Logit-Regression 825
Probit-Regression 827
2.2 Schätzung 827
2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität 828
Standardisierte Koeffizienten 829
Durchschnittliche marginale Effekte 830
2.4 Interaktionseffekte 831
2.5 Statistische Inferenz 833
2.6 Goodness of fit und Modellvergleich 834
3 Ein Beispiel 835
4 Häufige Fehler 843
5 Literaturempfehlungen 844
Literaturverzeichnis 845
32 Multinomiale und ordinale Regression 846
1 Einführung in das Verfahren 846
1.1 Von der binären zur multinomialen logistischen Regression 847
1.2 Wahrscheinlichkeiten, Odds und Logits 848
1.3 Modellschätzung und statistische Tests 852
Besteht ein Zusammenhang? 853
Wie stark ist ein Zusammenhang? 853
Wie stark sind die relativen Effekte der erklärenden Variablen? 854
1.4 Logistische Regression bei einer ordinalen abhängigen Variablen 855
1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression 857
2 Mathematisch-Statistische Grundlagen 859
2.1 Schätzung 859
2.2 Statistische Inferenz 860
2.3 Modellanpassung 861
2.4 Weiterführendes zu Regressionskoeffizienten 862
Standardisierte Koeffizienten im ordinalen Regressionsmodell 862
Umrechnen der Referenzkategorie im multinomialen Regressionsmodell 862
3 Anwendungsbeispiel 863
3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression 863
3.2 Bildungsabschluss im ordinalen Logitmodell 870
4 Häufige Fehler 873
5 Literaturempfehlungen 877
Literaturverzeichnis 877
33 Regression für Zählvariablen 878
1 Einführung in das Verfahren 878
1.1 Poisson und negative Binomialverteilung 879
1.2 Regressionsmodellierung 880
Strukturkomponente 880
Strukturkomponente: lineare und nichtlineare Prädiktoren 881
Verteilungskomponente 883
Inferenz 883
2 Mathematisch-statistische Grundlagen 884
2.1 Poissonmodell 884
Maximum-Likelihood-Schätzung 884
Parameter-Tests 885
Devianz und Anpassungstests 887
2.2 Quasi-Poissonmodell 888
2.3 Modell der negativen Binomialverteilung 889
3 Ein Beispiel 889
4 Häufige Fehler 893
5 Literaturempfehlungen 894
Literaturverzeichnis 894
34 Graphische Darstellung regressionsanalytischer Ergebnisse 896
1 Einführung in das Verfahren 896
2 Grundlagen der graphischen Darstellung 897
3 Beispiele 900
3.1 Streudiagramm- bzw. Scatterplot-Matrix 900
3.2 Median- und Mean-Regression 902
3.3 Lineare Regression: Graphische Darstellung der Koeffizienten 903
3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots) 905
3.5 Logistische Regression: Conditional-Effect-Plots 908
3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots 911
4 Häufige Fehler 915
5 Rückblick 916
6 Literaturempfehlungen 917
Literaturverzeichnis 918
Teil VI Analyse von zeitbezogenen Daten 919
35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren 920
1 Einführung in das Verfahren 920
1.1 Grundannahmen kausaler Inferenz in Matchingverfahren 921
1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse 924
1.3 Durchführung der empirischen Analyse 925
1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen 930
2 Mathematisch-statistische Grundlagen 931
3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes 937
3.1 Zuweisungsmodell 938
3.2 Matching und Balancierungstests 940
3.3 Parameterschätzung 944
4 Häufige Fehler 947
5 Literaturempfehlungen 949
Literaturverzeichnis 949
36 Kausalanalyse mit Paneldaten 951
1 Einführung in die Paneldatenanalyse 951
1.1 Kontrafaktische Kausalanalyse und Paneldaten 952
1.2 Eine intuitive Einführung in Panelregressionsmodelle 954
1.3 Ein didaktisches Beispiel 956
2 Eine präzisere Einführung in die Panelregression 959
2.1 Das Fehlerkomponenten-Modell 960
2.2 Die Schätzverfahren 960
2.3 RE- oder FE-Modell? 963
2.4 Ein Hybrid-Modell 964
2.5 Panel-robuste Standardfehler 965
3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit 966
3.1 Datenaufbereitung 966
3.2 Schätzergebnisse 968
3.3 Ein Modell mit Periodeneffekten 970
3.4 Ein Hybrid-Modell 971
3.5 Ein Wachstumskurven-Modell 972
4 Nicht-lineare FE-Modelle 973
4.1 Nicht-lineare Panelregressionsmodelle 974
4.2 Das FE-Logit Modell 974
4.3 FE-Modelle für Ereignisdaten 976
5 Häufige Fehler 978
5.1 Suboptimale Panelregressionsmodelle 978
5.2 Grenzen von FE-Modellen 979
6 Literaturempfehlungen 981
Literaturverzeichnis 981
37 Survival- und Ereignisanalyse 983
1 Einführung in das Verfahren 983
1.1 Spezifische Problemstellungen 984
1.2 Erhebung von Ereignisdaten 986
1.3 Zensierung von Beobachtungen 987
2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation 988
2.1 Verschiedene Ratenmodelle und ihre Schätzung 991
Sterbetafelmethode und Kaplan-Meier-Schätzung 991
Das Exponentialmodell 992
Das Cox-Modell 992
Das Piecewise-Constant-Modell 993
Parametrische Modelle der Zeitabhängigkeit 994
2.2 Ein Beispiel 994
3 Modellierung von parallelen und interdependenten Prozessen 996
3.1 Ursachen und zeitabhängige Kovariablen 997
3.2 Zeit und kausale Wirkungen 998
3.3 Zeitachse und Ereignisse 998
3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit 998
3.5 Zeitliche Form der Entfaltung von Wirkungen 999
3.6 Das Prinzip der konditionalen Unabhängigkeit 999
3.7 Ein Anwendungsbeispiel 1000
4 Häufige Fehler 1001
5 Literaturempfehlungen 1002
Literaturverzeichnis 1003
38 Latente Wachstumskurvenmodelle 1005
1 Einführung in das Verfahren 1005
2 Mathematisch-statistische Grundlagen 1009
3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust 1012
4 Häufige Fehler 1014
5 Literaturempfehlungen 1016
Literaturverzeichnis 1016
39 Sequenzdatenanalyse 1018
1 Einführung in die Sequenzdatenanalyse 1018
1.1 Was ist Sequenzdatenanalyse? 1019
1.2 Grundlegende Konzepte 1020
2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung 1024
2.1 Der Optimal Matching Algorithmus 1024
2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen 1026
2.3 Die Diskussion um OM und neuere Entwicklungen 1026
3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen 1028
3.1 Datenaufbereitung 1028
3.2 Datenauswertung 1030
4 Häufige Fehler 1035
5 Literaturempfehlungen 1037
Literaturverzeichnis 1037
40 Zeitreihenanalyse 1039
1 Einführung 1039
2 Deskription und statistisches Modell 1041
3 Stochastische Prozesse 1042
4 Nichtstationäre (stochastische) Prozesse 1047
5 Tests auf „Random Walk“ 1049
6 Zerlegung von Zeitreihen 1053
7 Interventionsanalyse 1059
8 Ausreißer-Analyse 1061
9 Transferfunktions-Modelle 1064
10 Vektorielle stochastische Prozesse 1068
11 Schluss 1073
12 Literaturempfehlungen 1074
Literaturverzeichnis 1074
Anhang 1077
Autorenverzeichnis 1078

Erscheint lt. Verlag 26.4.2011
Zusatzinfo 1098 S. 275 Abb.
Verlagsort Wiesbaden
Sprache deutsch
Themenwelt Sachbuch/Ratgeber Gesundheit / Leben / Psychologie
Geisteswissenschaften
Mathematik / Informatik Mathematik Statistik
Sozialwissenschaften Politik / Verwaltung
Sozialwissenschaften Soziologie
Technik
Schlagworte Clusteranalyse • Datenaufbereitung • Datenexploration • Datengewinnung • Deskriptive Statistik • Kausalität • Kovarianz • Mehrebenenanalyse • Paneldaten • Querschnitt • skalieren • Strukturgleichungsmodell • Strukturgleichungsmodelle • Varianz • Varianzanalyse
ISBN-10 3-531-92038-3 / 3531920383
ISBN-13 978-3-531-92038-2 / 9783531920382
Haben Sie eine Frage zum Produkt?
PDFPDF (Wasserzeichen)
Größe: 8,5 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.

Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich