E-Book, Deutsch, Band 2, 115 Seiten
Eine verständliche Einführung für Studium und Praxis
E-Book, Deutsch, Band 2, 115 Seiten
Reihe: Sozialwissenschaftliche Forschungsmethoden
ISBN: 978-3-86618-560-9
Verlag: Edition Rainer Hampp
Format: PDF
Kopierschutz: Adobe DRM (»Systemvoraussetzungen)
Autoren/Hrsg.
Weitere Infos & Material
1;Vorwort;8
2;Inhaltsverzeichnis;10
3;Verwendete griechische Buchstaben;12
4;1 Bedeutung des Rasch-Modells für die Entwicklung psychologischer Tests;14
5;2 Mathematische Formulierung und inhaltliche Bedeutung des Rasch-Modells;18
5.1;2.1 Die Datenmatrix;18
5.2;2.2 Die Modellgleichung;20
5.3;2.3 Aufgaben- und Personencharakteristische Kurven;23
5.4;2.4 Unterschiedliche Darstellungen der Modellgleichung;25
5.5;2.5 Zentrale Annahmen und Eigenschaften;27
5.5.1;Suffiziente Statistiken;27
5.5.2;Lokale Stochastische Unabhängigkeit;29
5.5.3;Spezifische Objektivität;33
5.5.4;Eindimensionalität;36
5.5.5;Messniveau;36
6;3 Parameterschätzung;40
6.1;3.1 Schätzansätze für das Rasch-Modell;40
6.1.1;3.1.1 Gemeinsame Maximum-Likelihood-Schätzung;41
6.1.2;3.1.2 Bedingte Maximum-Likelihood-Schätzung;42
6.1.3;3.1.3 Marginale Maximum-Likelihood-Schätzung;46
6.1.4;3.1.4 Weitere Schätzansätze;47
6.2;3.2 Die Information von Aufgaben und Tests;48
7;4 Überprüfung der Modellannahmen;52
7.1;4.1 Der graphische Modelltest;52
7.2;4.2 Der Likelihood-Quotienten-Test;54
7.3;4.3 Wald-Tests;57
7.3.1;4.3.1 Aufgaben-spezifischer Wald-Test;57
7.3.2;4.3.2 Globaler Wald-Test;58
7.4;4.4 Weitere Modellgeltungstests für Differential Item Functioning und Mehrdimensionalität;58
7.5;4.5 Der x2-Anpassungstest;59
8;5 Ausblick auf verwandte Modelle;62
8.1;5.1 Das linear-logistische-Testmodell;62
8.2;5.2 Birnbaum-Modelle;63
8.2.1;5.2.1 Das zwei-parametrige Birnbaum-Modell;63
8.2.2;5.2.2 Das Birnbaum-Modell mit zusätzlichem Rateparameter;65
8.3;5.3 Modelle mit mehrstufigen Antwortkategorien;67
8.3.1;5.3.1 Das Partial-Credit-Modell;67
8.3.2;5.3.2 Weitere Modelle für mehrstufige Antwortkategorien;70
8.3.3;Das Rating-Scale-Modell;70
8.3.4;Das Graded-Response-Modell;70
8.4;5.4 Modellierung von Unterschieden zwischen Personen;71
8.4.1;5.4.1 Mischverteilungs-Rasch-Modell;71
8.4.2;5.4.2 Modellbasierte rekursive Partitionierung;72
8.4.3;5.4.3 Das Rasch-Modell als gemischtes Modell;73
8.5;5.5 Mehrdimensionale Rasch-Modelle;74
9;A Anpassung von Rasch-Modellen mit R;76
9.1;A.1 Vorbereitungen;76
9.2;A.2 R-Paket eRm;77
9.2.1;A.2.1 Bedingte Maximum-Likelihood-Schatzung der Aufgaben-Parameter;78
9.2.2;A.2.2 Modellkontrolle und Aufgaben-Selektion;78
9.2.3;A.2.3 Graphische Darstellung;82
9.2.4;A.2.4 Schätzung der Personen-Parameter;83
9.3;A.3 R-Paket ltm;84
9.3.1;A.3.1 Marginale Maximum-Likelihood-Schätzung der Aufgaben-Parameter;84
9.3.2;A.3.2 Modellkontrolle und Aufgaben-Selektion;85
9.3.3;A.3.3 Graphische Darstellung;86
9.3.4;A.3.4 Schätzung der Personen-Parameter;88
9.4;A.4 Weitere R-Pakete zur Anpassung von IRT-Modellen;88
10;B Mathematische und statistische Grundlagen;90
10.1;B.1 Mathematische Grundlagen;90
10.1.1;B.1.1 Summen- und Produktzeichen;90
10.1.2;B.1.2 Rechenregeln für Exponentialfunktion und Logarithmus;90
10.1.3;B.1.3 Ableitungsregeln;91
10.2;B.2 Grundlagen der Maximum-Likelihood-Schätzung;93
10.3;B.3 Grundlagen statistischer Tests;103
10.3.1;B.3.1 Tests basierend auf der x2-Verteilung;103
10.3.2;Testentscheidung anhand des Ablehnbereiches;104
10.3.3;Testentscheidung anhand des p-Wertes;105
10.3.4;B.3.2 Tests basierend auf der Normalverteilung;106
11;Literaturverzeichnis;108
12;Autorenregister;112
13;Index;114
1 Bedeutung des Rasch-Modells für die Entwicklung psychologischer Tests (S. 1-2)
In vielen Situationen im schulischen, beruflichen und klinischen Alltag werden psychologische Tests verwendet, z.B. um die mathematische Kompetenz von Schülern, die Eignung von Bewerbern, die Kundenzufriedenheit, bestimmte Persönlichkeitseigenschaften oder die Neigung zu Depressionen zu messen. Bei den zu messenden Eigenschaften der Personen handelt es sich dabei um latente, d.h. nicht direkt beobachtbare, Merkmale. Um diese Merkmale zu erfassen, werden den Personen in einem psychologischen Test mehrere Aufgaben gestellt, deren Beantwortung Aufschluss über die interessierende Eigenschaft geben soll.
Bei einem Leistungs- oder Intelligenztest wird z.B. erfasst, welche bzw. wie viele Aufgaben die Person richtig beantwortet hat. Bei einem Test zur Messung einer Persönlichkeitseigenschaft wird hingegen die Zustimmung und Ablehnung zu vorgegebenen Aussagen protokolliert. Als Ergebnis des Tests erhält die Person eine Schätzung ihrer Fähigkeit bzw. ihrer Ausprägung der latenten Eigenschaft.
Vor der Verwendung des fertigen Tests liegt aber die Phase der Testkonstruktion: Ein Expertenteam generiert dafür zunächst einen Satz von Aufgaben, die z.B. mathematische Kompetenzen von Grundschülern der 1. und 2. Klasse abdecken. Diese Aufgaben werden dann einer kritischen Prüfung unterzogen, und oft müssen Aufgaben aussortiert werden, weil sie bestimmte Kriterien nicht erfüllen.
Eine der häufigsten Ursachen für den Ausschluss von Aufgaben ist, dass sie nicht nur die interessierende Eigenschaft messen, sondern noch weitere Eigenschaften sich auf die Beantwortung der Frage auswirken. Bei der Entwicklung eines Tests zur Messung der mathematischen Kompetenz von Grundschülern können z.B. Aufgaben vorkommen, die - neben der mathematischen Kompetenz - auch durch die verbale Kompetenz der Schüler beeinflusst werden: Da es sich bei vielen Mathematik-Aufgaben um Textaufgaben handelt, kann die Formulierung der Aufgabe z.B. Schüler mit Deutsch als Fremdsprache benachteiligen, so dass sie in dem Test schlechter abschneiden - obwohl sie genauso gut in Mathematik sind wie ihre Mitschüler.
So können einzelne Aufgaben, die bestimmte Gruppen von Personen bevorzugen oder benachteiligen, dazu führen, dass das gesamte Testergebnis verzerrt ist und faire Vergleiche zwischen den Personen nicht mehr möglich sind. Um das zu verhindern, müssen alle Test-Aufgaben in der Konstruktions-Phase des Tests einer strengen Prüfung unterzogen werden, z.B. mithilfe des Rasch- Modells. So können nachweislich unfaire Aufgaben aus dem Test ausgeschlossen bzw. durch andere Aufgaben ersetzt werden. Erst wenn der Test aus den restlichen Aufgaben alle Prüfungen erfüllt, ist er "fertig und kann sinnvoll zur Testung in der Praxis verwendet werden. Aus diesem Grund - und nicht etwa, um die Leser unnötig zu quälen - nimmt die statistische Überprüfung von psychologischen Tests in den Lehrbüchern zur Testtheorie und Testkonstruktion oft mehr Raum ein als die praktische Anwendung der fertigen Tests: Nur psychologische Tests, die eine strenge Überprüfung bestanden haben, erlauben objektive Messungen und faire Vergleiche.