Testtheorie, Testkonstruktion, Testevaluation (eBook)

eBook Download: EPUB
2022 | 2. Auflage
251 Seiten
UTB (Verlag)
978-3-8463-5833-7 (ISBN)

Lese- und Medienproben

Testtheorie, Testkonstruktion, Testevaluation -  Markus Pospeschill
Systemvoraussetzungen
28,99 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Die Theorie, Planung und Überprüfung von Tests ist ein wichtiger, prüfungsrelevanter Bereich im Psychologiestudium. Auch in der späteren Praxis ist es unverzichtbar, Tests richtig anwenden und in ihrem Ergebnis beurteilen zu können. Dieses Buch gibt Studierenden eine verständliche und fundierte Einführung in Kriterien wissenschaftlicher Testgüte, Testentwicklung und Itemkonstruktion, klassische und probabilistische Testtheorie, Testevaluation und Interpretation von Testresultaten. Vertiefende Kapitel beschreiben u. a. den Einsatz von Statistik-Software und die Durchführung von Faktorenanalysen. Mit Schlüsselbegriffen in der Marginalienspalte, Definitionen, Zusammenfassungen und Kontrollfragen bestens zur Prüfungsvorbereitung geeignet!

PD Dr. Markus Pospeschill lehrt und forscht in den Bereichen Methodenlehre, Forschungsmethoden und Psychodiagnostik am Institut für Psychologie der Universität Saarbrücken.

PD Dr. Markus Pospeschill lehrt und forscht in den Bereichen Methodenlehre, Forschungsmethoden und Psychodiagnostik am Institut für Psychologie der Universität Saarbrücken.

Hinweise zur Benutzung dieses Lehrbuches9
Vorwort zur zweiten Auflage10
Road (Concept) Map12
I Testtheoretische Grundlagen
1 Kriterien wissenschaftlicher Testgüte16
1.1 Objektivität18
1.2 Reliabilität21
1.3 Validität24
1.4 Normierung / Testeichung.28
1.5 Skalierung30
1.6 Ökonomie / Wirtschaftlichkeit30
1.7 Nützlichkeit / Utilität30
1.8 Zumutbarkeit31
1.9 Unverfälschbarkeit31
1.10 Testfairness31
1.11 Vergleichbarkeit32
1.12 Transparenz32
2 Testentwicklung35
2.1 Testplanung.35
2.1.1 Festlegung der Erhebungsmerkmale36
2.1.2 Festlegung der Testart37
2.1.3 Festlegung des Geltungsbereichs38
2.2 Strategien zur Testentwicklung40
2.2.1 Rationale Konstruktionsstrategie40
2.2.2 Externale Konstruktionsstrategie41
2.2.3 Induktive Konstruktionsstrategie42
2.2.4 Prototypenansatz.43
2.2.5 Intuitive Konstruktionsstrategie43
2.3 Itemkonstruktion44
2.3.1 Items mit offenem Antwortformat45
2.3.2 Items mit gebundenem Antwortformat47
2.4 Fehlerquellen bei der Beantwortung von Items58
2.4.1 Soziale Erwünschtheit59
2.4.2 Antworttendenzen62
2.5 Prinzipien der Itemformulierung63
2.5.1 Itemarten64
2.5.2 Itemverständlichkeit.65
2.5.3 Itemvariabilität.66
2.6 Erstellung einer Test-Betaversion67
2.6.1 Testanweisung67
2.6.2 Anordnung des Itempools68
2.6.3 Erprobung der Test-Betaversion69
3 Testevaluation72
3.1 Datenstruktur der Messungen72
3.2 Itemschwierigkeit73
3.2.1 Itemschwierigkeit bei Leistungstests.74
3.2.2 Itemschwierigkeit bei Persönlichkeitstests76
3.3 Itemvarianz77
3.4 Itemtrennschärfe80
3.4.1 Berechnungen der Trennschärfe80
3.4.2 Interpretation der Trennschärfe82
3.4.3 Part-Whole-Korrektur 83
3.4.4 Selektionskennwert83
3.5 Kriterien der Itemselektion.85
3.6 Testwertermittlung86
3.6.1 Testwertermittlung bei Leistungstests86
3.6.2 Testwertermittlung bei Persönlichkeitstests87
3.6.3 Statistische Maße88
3.6.4 Normalisierung schiefer Testwertverteilungen93
4 Klassische Testtheorie97
4.1 Axiome der Klassischen Testtheorie97
4.1.1 Existenzaxiom97
4.1.2 Verknüpfungsaxiom98
4.1.3 Unabhängigkeitsaxiom98
4.1.4 Zusatzannahmen98
4.1.5 Erläuterungen zum Konzept des Messfehlers99
4.2 Bestimmung des wahren Testwertes101
4.3 Bestimmung der wahren Varianz und Fehlervarianz102
4.4 Bestimmung der Reliabilität103
4.5 Reliabilität und Testlänge104
4.6 Standardmessfehler105
4.7 Konfidenzintervall des wahren Testwertes107
4.8 Minderungskorrekturen.107
4.9 Kritik an der Klassischen Testtheorie.109
4.10 Modellbasierte Methoden zur Schätzung der Reliabilität113
5 Probabilistische Testtheorie114
5.1 Manifeste und latente Variablen114
5.2 Lokale stochastische Unabhängigkeit.116
5.3 Latent-Trait-Modelle (LTM)119
5.3.1 Einparameter-Logistisches Modell (1PL)122
5.3.2 Zweiparameter-Logistisches Modell (2PL)132
5.3.3 Dreiparameter-Logistisches Modell (3PL)133
5.4 Latent-Class-Modelle (LCA)135
5.4.1 Allgemeine Modellgleichung der LCA136
5.4.2 Parameterschätzung und Modelltests in der LCA140
5.5 Modellerweiterungen148
5.5.1 Mixed-Rasch-Modelle148
5.5.2 Ordinales Rasch-Modell150
5.6 Adaptives Testen153
5.6.1 Strategien der Itemauswahl154
5.6.2 Vor- und Nachteile adaptiven Testens.156
II Methodische Überprüfung
6 Testgütebestimmung und Interpretation von Testresultaten160
6.1 Reliabilität160
6.1.1 Test-Retest-Reliabilität161
6.1.2 Paralleltest-Reliabilität163
6.1.3 Splithalf-Reliabilität165
6.1.4 Interne Konsistenz.167
6.1.5 Zusammenfassende Würdigung170
6.2 Validität177
6.2.1 Inhaltsvalidität178
6.2.2 Kriteriumsvalidität181
6.2.3 Konstruktvalidität183
6.2.4 Zusammenfassende Würdigung186
6.3 Norm- vs. Kriteriumsorientierung187
6.3.1 Normorientierte Testwertinterpretation188
6.3.2 Kriteriumsorientierte Testwertinterpretation 193
7 Faktorenanalyse199
7.1 Exploratorische Faktorenanalyse199
7.1.1 Extraktionsmethode200
7.1.2 Fundamentaltheorem201
7.1.3 Abbruchkriterien204
7.1.4 Rotationsmethoden206
7.1.

Testentwicklung

Der Prozess der Entstehung eines Tests verläuft von der ersten Testplanung über die Testentwicklung bis hin zur Erstellung und vorläufigen Erprobung einer Vorversion mit dem Ziel der Revision zum finalen Test. Gerade in dieser systematischen Genese liegt die Besonderheit psychometrischer Tests, die psychische Merkmale quantitativ auf der Grundlage testtheoretischer Überlegungen konzipieren und erfassen, systematisch anhand standardisierter Verfahren auswerten und damit eine metrisch vergleichende Diagnostik gewährleisten.

Psychologische Tests weisen aus diesem Grund eine komplexe Struktur auf. Ihre Bestandteile – die Testaufgaben bzw. Items – sind zumeist zahlreich, auf unterschiedliche Facetten eines Konstruktes gerichtet und sollen eine messgenaue Erfassung des Konstruktes unter Minimierung von Messfehlern erlauben. Ziel ist es, über mehrere Items eine Abschätzung der Reliabilität zu erzielen.

2.1 Testplanung

Die Planung eines Tests beginnt grundsätzlich mit Überlegungen, das zu messende Konstrukt möglichst genau zu definieren bzw. seine Charakteristika festzulegen. Dies geschieht im Idealfall auf der Basis eines psychologischen Modells oder einer psychologischen Theorie. Ist dies (noch) nicht möglich, müssen zunächst vorläufige Explikationen oder Arbeitsmodelle reichen, bis sie im Verlauf weiterer Forschungen präzisiert werden können (s. Fisseni, 2004). Auch Befragungen von Experten oder Personengruppen, die besonders hohe oder niedrige Ausprägungen der entsprechenden Fähigkeit oder Eigenschaft aufweisen, können wichtige Hinweise auf verhaltensrelevante Aspekte des Konstruktes liefern.

Definition des
Konstruktes

Zur weiteren Eingrenzung des Konstruktes sollte aus der Literatur (Lehrbüchern, Überblicksartikeln etc.), aus vorhandenen Theorien, empirischen Befunden und eigenen Überlegungen eine Arbeitsdefinition des Konstruktes formuliert werden. Auf der Basis einer psychologischen Theorie und einer ersten Eingrenzung des Konstruktes können dann weitere Entscheidungen hinsichtlich der Natur der Merkmale, der Testart und des angestrebten Geltungsbereiches des Tests getroffen werden.

2.1.1 Festlegung der Erhebungsmerkmale

Qualitäten von Erhebungsmerkmalen

In Abhängigkeit von der psychologischen Theorie und der Operationalisierbarkeit des Konstruktes können die Erhebungsmerkmale verschiedene Qualitäten und Eigenschaften aufweisen.

Qualitative Merkmale (mit kategorialen Ausprägungen) vs. quantitative Merkmale (mit graduellen Abstufungen): Aus der Natur der Merkmale resultieren im ersten Fall nominalskalierte, im zweiten Fall ordinal- oder intervallskalierte Messungen. Qualitative Merkmale unterteilen Personengruppen lediglich anhand einzelner Kategorien (z. B. Geschlecht, Familienstand oder letzter Schulabschluss), während quantitative Merkmale graduell abgestufte Merkmalseinteilungen erlauben (z. B. anhand eines Intelligenzquotienten oder anhand der erreichten Punktezahl in einem Test).

Eindimensionale (nur ein Konstrukt repräsentierende) Merkmale vs. mehrdimensionale (mehr als ein Konstrukt repräsentierende) Merkmale: Fragen zur Ein- oder Mehrdimensionalität eines Konstruktes lassen sich über Exploratorische Faktorenanalysen (EFA) oder andere Korrelationsstatistiken klären und später ggf. in einzelnen Subtests (Untertests) berücksichtigen. Ein typisches Beispiel für ein mehrdimensionales Konstrukt mit verschiedenen Faktoren ist z. B. „Lebensqualität“, mit dem die materiellen und soziokulturellen Lebensbedingungen einzelner Individuen in einer Gesellschaft zusammengefasst werden (u. a. Einkommen, Bildung, Berufschancen, sozialer Status, Gesundheit). Tests, die entsprechend nur ein Konstrukt erfassen, werden als unidimensionale Tests, Tests die mehrere Konstrukte erfassen, als multidimensionale Tests bezeichnet. Letztere zerfallen häufig in sog. Subtests, die wiederum unidimensional sind.

Zeitlich stabile Merkmale (Traits) vs. zeitlich veränderliche Merkmale (States): Persönlichkeitsmerkmale werden als Traits aufgefasst, während situationsabhängige Zustände als States betrachtet werden.

2.1.2 Festlegung der Testart

Wiederum ist in Abhängigkeit vom Konstrukt eine Entscheidung bezüglich der Testart zu treffen (eine genauere Differenzierung findet sich in Pospeschill & Spinath, 2009):

Leistungstests

Fähigkeiten und Leistung

Fähigkeits- und Leistungstests erfassen Konstrukte, die sich auf Dimensionen der kognitiven Leistungsfähigkeit (maximales Leistungsverhalten) beziehen. Zentrale Konstrukte sind hier z. B.: Problemlösefähigkeit, Wissensreproduktion, spezifische Fähigkeiten, Ausdauer, Konzentrationsvermögen. Eine Unterteilung erfolgt nach: Speed- oder Geschwindigkeitstests (mit einfachen Aufgaben, aber mit Begrenzung der Bearbeitungszeit und Bewertung der richtigen Antworten), Power- oder Niveautests (mit schwierigen Aufgaben, ohne Zeitbegrenzung und Bewertung über das Schwierigkeitsniveau der Aufgaben) und Mischformen (Speed-Power-Tests) aus beiden Testarten.

Persönlichkeitstests

Einstellungen und Verhalten

Persönlichkeitstests erfassen das für eine Person typische Verhalten im Zusammenhang mit spezifischen Ausprägungen von Persönlichkeitsmerkmalen (Verhaltensdispositionen), z. B. aktuelle Zustände (wie Angst), Motivation, Interesse, Einstellungen, Meinungen oder spezifische Persönlichkeitseigenschaften. Folgerichtig wird keine Leistung erwartet, sondern eine Selbstauskunft über persönliches Verhalten (Persönlichkeitsfragebogen). Es gibt keine „richtigen“ oder „falschen“ Antworten, sondern nur unterschiedlich hohe Ausprägungen von Merkmalen. Bei der Beantwortung spielen Aspekte der Spontaneität, der Wahrheitstreue und die Motivation der Probanden eine zentrale Rolle. Subjektive Angaben neigen dabei allerdings prinzipiell zur Verfälschbarkeit.

Objektive Persönlichkeitstests

Objektive Persönlichkeitstests besitzen keine Augenscheinvalidität, d. h. die Probanden können aus der Testinstruktion und den Testaufgaben nicht (wirklich) erkennen, was der Test eigentlich misst. Entsprechend wird auf das Merkmal nicht über subjektive Urteile der eigenen Person, sondern über das Verhalten in einer standardisierten Testsituation zurückgeschlossen.

Projektive Verfahren

Projektive Verfahren (sog. Persönlichkeits-Entfaltungstests) erfassen die Gesamtpersönlichkeit anhand qualitativer Marker. Das Testmaterial ist dabei zumeist bildhaft und mehrdeutig. Dadurch soll den Probanden Gelegenheit gegeben werden, unbewusste und verdrängte Bewusstseinsinhalte in dieses Bildmaterial zu projizieren. So gesehen sind auch diese Verfahren für die Probanden undurchschaubar. Projektive Verfahren erfüllen die Testgütekriterien nur in Ausnahmefällen und dienen daher eher zumeist als Explorationshilfen. Vor einer Verwendung ist daher immer zu prüfen, ob sich die benötigten diagnostischen Daten nicht durch alternative Verfahren erheben lassen, deren psychometrische Gütekriterien besser erfüllt sind.

2.1.3 Festlegung des Geltungsbereichs

Der Geltungsbereich legt die Einsatzbereiche und Anwendungsmöglichkeiten eines Tests fest und ist von verschiedenen Faktoren abhängig.

Heterogenität vs. Homogenität von Aufgaben

inhaltliche Vielfalt

Mit Anwachsen des Geltungsbereichs eines Tests müssen auch mehr Informationen erfasst werden, damit die geforderten Kriterien mit ausreichender Genauigkeit vorhergesagt werden können. Dies erhöht allerdings auch die Heterogenität der Aufgaben. Dem steht die Empfehlung gegenüber, den Geltungsbereich unter testtheoretischen Gesichtspunkten möglichst eng zu definieren, also nur gezielte Verhaltens- oder Leistungsaspekte zu erfassen, was wiederum die Anzahl der erfassten Kriterien einschränkt. Damit gewinnen die Aufgaben an Homogenität. Die notwendige Entscheidung hat z. B. Auswirkungen auf die Kriteriumsvalidität, da mit der Auswahl der Aufgaben auch die Kriterien festgelegt werden, die der Test vorhersagen soll.

Analysestichprobe, Eichstichprobe und Personenkreis des Tests

Zielgruppe

Sowohl die Zusammensetzung der Stichprobe zur Erprobung des Tests (Analysestichprobe), zur Gewinnung von Normwerten (Eichstichprobe) sowie eine Entscheidung über die Zielgruppe beeinflussen den Geltungsbereich des Tests maßgeblich. Während die Analysestichprobe der Itemanalyse dient, soll anhand der Eichstichprobe die Validität des Tests festgestellt und eine Normierung der Ergebnisse vorgenommen werden. Beide Stichproben sind unabhängig voneinander zu ziehen. Beide Stichproben (insbesondere die Eichstichprobe) sollten die gleichen Ein- und Ausschlusskriterien erfüllen, die auch für den Personenkreis zutrifft, für den der Test Aussagen treffen will. Ist die avisierte Zielgruppe eher breit angelegt, müssen sich die Items über einen größeren Schwierigkeits- bzw. Merkmalsbereich erstrecken und ggf....

Erscheint lt. Verlag 14.2.2022
Zusatzinfo 77 Übungsfragen
Verlagsort Stuttgart
Sprache deutsch
Themenwelt Geisteswissenschaften Psychologie
Schlagworte Adaptives Testen • Adaptive Tests • Einparameter-Logistisches Modell • Erhebungsmerkmale von Tests • Erstellung von Tests in der Psychologie • Faktoranalysen • Interpretation von Testresultaten • Itemauswahl • Klassische Testtheorie • Kriterien wissenschaftlicher Testgüte • lantente Variablen • Latent-Class-Modelle • Latent-Trait-Modelle • Lehrbuch • Modellerweiterungen • Modelltests • Ordinales Rasch-Model • Parameterschätzung • prohabilistische Testtheorie • Psychologie • Psychologiestudium • Rasch-Modell • Reliabilität • Standardmessfehler • Standardmessmethoden • Statistik-Software • stochastische Unabhängigkeit • Studium Psychologie • Test • Testeichung • Testentwicklung • Testerstellung in der Psychologie • Testevaluation • Testkonstruktion • Testnominierung • Testtheoretische Grundlagen • Testtheorie
ISBN-10 3-8463-5833-9 / 3846358339
ISBN-13 978-3-8463-5833-7 / 9783846358337
Haben Sie eine Frage zum Produkt?
EPUBEPUB (Wasserzeichen)

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belle­tristik und Sach­büchern. Der Fließ­text wird dynamisch an die Display- und Schrift­größe ange­passt. Auch für mobile Lese­geräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Wie Frauen ihren Asperger-Mann lieben und verstehen

von Eva Daniels

eBook Download (2022)
Trias (Verlag)
19,99
Erfolgreiches Lernen und Lehren

von Marcus Hasselhorn; Andreas Gold

eBook Download (2022)
Kohlhammer Verlag
43,99