Das Rasch-Modell (eBook)
115 Seiten
Rainer Hampp Verlag
978-3-86618-560-9 (ISBN)
Im schulischen und beruflichen Alltag werden häufig psychologische Tests verwendet, um z.B. die Kompetenz von Schülern oder die Eignung von Bewerbern zu messen. Damit ein psychologischer Test faire Vergleiche zwischen Personen erlaubt, muss er allerdings bestimmte Anforderungen erfüllen. Das Rasch-Modell ermöglicht durch seine mathematische Formulierung die Überprüfung dieser Anforderungen. Es wird u.a. in der empirischen Bildungsforschung zur praktischen Konstruktion von Tests eingesetzt und gehört als wichtigster Vertreter der sogenannten probabilistischen Testtheorie standardmäßig zum Prüfungsstoff in Psychologie und verwandten Studiengängen. Dieses Buch gibt eine verständliche Einführung in die Thematik der Konstruktion und Validierung psychologischer Tests mithilfe des Rasch-Modells. Alle nötigen mathematischen und statistischen Grundlagen werden dabei in einem Anhang und begleitenden Fußnoten erläutert. Dadurch ist dieses Buch unabhängig von der mathematischen Vorbildung als Einführung und zur Prüfungsvorbereitung geeignet. Neben der verständlichen Darstellung der zugrundeliegenden Theorie bietet dieses Buch auch eine praktische Einführung in die Anpassung von Rasch-Modellen mithilfe der frei verfügbaren Statistik-Software R. Dadurch können die im Buch erklärten Verfahren direkt auf eigene Daten angewendet werden.
Carolin Strobl ist Diplom-Psychologin und Statistikerin. Sie habilitiert am Institut für Statistik der Ludwig-Maximilians-Universität München. Ihre Forschungsschwerpunkte sind psychometrische Methoden, Variablenselektion und Machine-Learning Verfahren.
Carolin Strobl ist Diplom-Psychologin und Statistikerin. Sie habilitiert am Institut für Statistik der Ludwig-Maximilians-Universität München. Ihre Forschungsschwerpunkte sind psychometrische Methoden, Variablenselektion und Machine-Learning Verfahren.
Vorwort 8
Inhaltsverzeichnis 10
Verwendete griechische Buchstaben 12
1 Bedeutung des Rasch-Modells für die Entwicklung psychologischer Tests 14
2 Mathematische Formulierung und inhaltliche Bedeutung des Rasch-Modells 18
2.1 Die Datenmatrix 18
2.2 Die Modellgleichung 20
2.3 Aufgaben- und Personencharakteristische Kurven 23
2.4 Unterschiedliche Darstellungen der Modellgleichung 25
2.5 Zentrale Annahmen und Eigenschaften 27
Suffiziente Statistiken 27
Lokale Stochastische Unabhängigkeit 29
Spezifische Objektivität 33
Eindimensionalität 36
Messniveau 36
3 Parameterschätzung 40
3.1 Schätzansätze für das Rasch-Modell 40
3.1.1 Gemeinsame Maximum-Likelihood-Schätzung 41
3.1.2 Bedingte Maximum-Likelihood-Schätzung 42
3.1.3 Marginale Maximum-Likelihood-Schätzung 46
3.1.4 Weitere Schätzansätze 47
3.2 Die Information von Aufgaben und Tests 48
4 Überprüfung der Modellannahmen 52
4.1 Der graphische Modelltest 52
4.2 Der Likelihood-Quotienten-Test 54
4.3 Wald-Tests 57
4.3.1 Aufgaben-spezifischer Wald-Test 57
4.3.2 Globaler Wald-Test 58
4.4 Weitere Modellgeltungstests für Differential Item Functioning und Mehrdimensionalität 58
4.5 Der x2-Anpassungstest 59
5 Ausblick auf verwandte Modelle 62
5.1 Das linear-logistische-Testmodell 62
5.2 Birnbaum-Modelle 63
5.2.1 Das zwei-parametrige Birnbaum-Modell 63
5.2.2 Das Birnbaum-Modell mit zusätzlichem Rateparameter 65
5.3 Modelle mit mehrstufigen Antwortkategorien 67
5.3.1 Das Partial-Credit-Modell 67
5.3.2 Weitere Modelle für mehrstufige Antwortkategorien 70
Das Rating-Scale-Modell 70
Das Graded-Response-Modell 70
5.4 Modellierung von Unterschieden zwischen Personen 71
5.4.1 Mischverteilungs-Rasch-Modell 71
5.4.2 Modellbasierte rekursive Partitionierung 72
5.4.3 Das Rasch-Modell als gemischtes Modell 73
5.5 Mehrdimensionale Rasch-Modelle 74
A Anpassung von Rasch-Modellen mit R 76
A.1 Vorbereitungen 76
A.2 R-Paket eRm 77
A.2.1 Bedingte Maximum-Likelihood-Schatzung der Aufgaben-Parameter 78
A.2.2 Modellkontrolle und Aufgaben-Selektion 78
A.2.3 Graphische Darstellung 82
A.2.4 Schätzung der Personen-Parameter 83
A.3 R-Paket ltm 84
A.3.1 Marginale Maximum-Likelihood-Schätzung der Aufgaben-Parameter 84
A.3.2 Modellkontrolle und Aufgaben-Selektion 85
A.3.3 Graphische Darstellung 86
A.3.4 Schätzung der Personen-Parameter 88
A.4 Weitere R-Pakete zur Anpassung von IRT-Modellen 88
B Mathematische und statistische Grundlagen 90
B.1 Mathematische Grundlagen 90
B.1.1 Summen- und Produktzeichen 90
B.1.2 Rechenregeln für Exponentialfunktion und Logarithmus 90
B.1.3 Ableitungsregeln 91
B.2 Grundlagen der Maximum-Likelihood-Schätzung 93
B.3 Grundlagen statistischer Tests 103
B.3.1 Tests basierend auf der x2-Verteilung 103
Testentscheidung anhand des Ablehnbereiches 104
Testentscheidung anhand des p-Wertes 105
B.3.2 Tests basierend auf der Normalverteilung 106
Literaturverzeichnis 108
Autorenregister 112
Index 114
1 Bedeutung des Rasch-Modells für die Entwicklung psychologischer Tests (S. 1-2)
In vielen Situationen im schulischen, beruflichen und klinischen Alltag werden psychologische Tests verwendet, z.B. um die mathematische Kompetenz von Schülern, die Eignung von Bewerbern, die Kundenzufriedenheit, bestimmte Persönlichkeitseigenschaften oder die Neigung zu Depressionen zu messen. Bei den zu messenden Eigenschaften der Personen handelt es sich dabei um latente, d.h. nicht direkt beobachtbare, Merkmale. Um diese Merkmale zu erfassen, werden den Personen in einem psychologischen Test mehrere Aufgaben gestellt, deren Beantwortung Aufschluss über die interessierende Eigenschaft geben soll.
Bei einem Leistungs- oder Intelligenztest wird z.B. erfasst, welche bzw. wie viele Aufgaben die Person richtig beantwortet hat. Bei einem Test zur Messung einer Persönlichkeitseigenschaft wird hingegen die Zustimmung und Ablehnung zu vorgegebenen Aussagen protokolliert. Als Ergebnis des Tests erhält die Person eine Schätzung ihrer Fähigkeit bzw. ihrer Ausprägung der latenten Eigenschaft.
Vor der Verwendung des fertigen Tests liegt aber die Phase der Testkonstruktion: Ein Expertenteam generiert dafür zunächst einen Satz von Aufgaben, die z.B. mathematische Kompetenzen von Grundschülern der 1. und 2. Klasse abdecken. Diese Aufgaben werden dann einer kritischen Prüfung unterzogen, und oft müssen Aufgaben aussortiert werden, weil sie bestimmte Kriterien nicht erfüllen.
Eine der häufigsten Ursachen für den Ausschluss von Aufgaben ist, dass sie nicht nur die interessierende Eigenschaft messen, sondern noch weitere Eigenschaften sich auf die Beantwortung der Frage auswirken. Bei der Entwicklung eines Tests zur Messung der mathematischen Kompetenz von Grundschülern können z.B. Aufgaben vorkommen, die - neben der mathematischen Kompetenz - auch durch die verbale Kompetenz der Schüler beeinflusst werden: Da es sich bei vielen Mathematik-Aufgaben um Textaufgaben handelt, kann die Formulierung der Aufgabe z.B. Schüler mit Deutsch als Fremdsprache benachteiligen, so dass sie in dem Test schlechter abschneiden - obwohl sie genauso gut in Mathematik sind wie ihre Mitschüler.
So können einzelne Aufgaben, die bestimmte Gruppen von Personen bevorzugen oder benachteiligen, dazu führen, dass das gesamte Testergebnis verzerrt ist und faire Vergleiche zwischen den Personen nicht mehr möglich sind. Um das zu verhindern, müssen alle Test-Aufgaben in der Konstruktions-Phase des Tests einer strengen Prüfung unterzogen werden, z.B. mithilfe des Rasch- Modells. So können nachweislich unfaire Aufgaben aus dem Test ausgeschlossen bzw. durch andere Aufgaben ersetzt werden. Erst wenn der Test aus den restlichen Aufgaben alle Prüfungen erfüllt, ist er "fertig und kann sinnvoll zur Testung in der Praxis verwendet werden. Aus diesem Grund - und nicht etwa, um die Leser unnötig zu quälen - nimmt die statistische Überprüfung von psychologischen Tests in den Lehrbüchern zur Testtheorie und Testkonstruktion oft mehr Raum ein als die praktische Anwendung der fertigen Tests: Nur psychologische Tests, die eine strenge Überprüfung bestanden haben, erlauben objektive Messungen und faire Vergleiche.
Erscheint lt. Verlag | 1.1.2010 |
---|---|
Reihe/Serie | Sozialwissenschaftliche Forschungsmethoden |
Sprache | deutsch |
Themenwelt | Geisteswissenschaften ► Psychologie ► Arbeits- und Organisationspsychologie |
Geisteswissenschaften ► Psychologie ► Test in der Psychologie | |
Naturwissenschaften ► Physik / Astronomie ► Astronomie / Astrophysik | |
Sozialwissenschaften ► Soziologie ► Empirische Sozialforschung | |
Schlagworte | Item-Response-Theorie • Psychologische Methodik • Psychologische Testtheorie • sozialwissenschaftliche Methodik |
ISBN-10 | 3-86618-560-X / 386618560X |
ISBN-13 | 978-3-86618-560-9 / 9783866185609 |
Haben Sie eine Frage zum Produkt? |
Größe: 1,2 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich