E-Book, Deutsch, 424 Seiten
Rudolf / Vogel-Blaschka Komplexe regressionsanalytische Verfahren
1. Auflage 2023
ISBN: 978-3-8444-2908-4
Verlag: Hogrefe Publishing
Format: EPUB
Kopierschutz: 6 - ePub Watermark
Eine praxisorientierte Einführung mit Anwendungsbeispielen in R und SPSS
E-Book, Deutsch, 424 Seiten
ISBN: 978-3-8444-2908-4
Verlag: Hogrefe Publishing
Format: EPUB
Kopierschutz: 6 - ePub Watermark
Für die Auswertung empirischer Untersuchungen werden oftmals spezialisierte Verfahren benötigt, die sich für bestimmte Datenmuster und Fragestellungen eignen. Dieses Lehrbuch wendet sich an alle, die einen Einstieg in komplexe regressionsanalytische Methoden und deren praktische Umsetzung suchen. Dabei werden wichtige Fragen beantwortet, die sich häufig bei der Auswertung komplexer Daten stellen: Wie wertet man Daten hierarchisch geordneter Ebenen aus? Wie werden Datenanalysen durchgeführt, wenn die Kriteriumsvariablen nicht normalverteilt oder kategorial sind? Wie geht man bei regressionsanalytischen Untersuchungen mit Messwiederholungen oder mit sehr vielen Prädiktoren vor?
Folgende Verfahren werden im Buch thematisiert: Verallgemeinerte lineare Modelle, verallgemeinerte Schätzgleichungen, Mehrebenenmodelle, ordinale und multinomiale logistische Regression, kanonische Korrelation, Ridge-Regression, Regression mit partiellen kleinsten Quadraten.
Alle im Text verwendeten Beispieldatensätze, kommentierte R-Skripte sowie kommentierte SPSS-Syntax-Dateien aller Analysen sind online verfügbar.
Zielgruppe
Wissenschaftlerinnen und Wissenschaftler, Studierende und Lehrende der Psychologie, Sozialwissenschaften, Medizin und BWL
Autoren/Hrsg.
Fachgebiete
Weitere Infos & Material
|13|Kapitel 1
Verallgemeinerte lineare Modelle
|14|1.1 Einleitung und Fragestellungen
Viele der in empirischen Wissenschaften häufig angewendeten statistischen Verfahren (z.?B. t-Tests, Varianzanalyse, multiple lineare Regressionsanalyse) basieren auf dem allgemeinen linearen Modell (ALM; engl.: General linear model (GLM)). Neben der Annahme linearer Beziehungen zwischen Prädiktor(en) und Kriterium setzt die Anwendung dieser Methoden unter anderem die Normalverteilung der Modellfehler in der Grundgesamtheit voraus. In vielen Anwendungsfällen kann diese Annahme als gegeben angesehen werden, bei geringen Verletzungen dieser Voraussetzung erweisen sich viele der Verfahren insbesondere bei großen Stichprobenumfängen als robust (siehe z.?B. Eid et al., 2017; Rudolf und Buse, 2020; Tabachnick und Fidell, 2018). In anderen Untersuchungen dagegen kann man nicht von normalverteilten Kriteriumsvariablen ausgehen. Verallgemeinerte (generalisierte) lineare Modelle (VLM; engl.: Generalized linear models (GZLM)) bieten die Möglichkeit, solche Daten sachgerecht auszuwerten (Nelder und Wedderburn, 1972). So bilden verallgemeinerte lineare Modelle die Basis bei der Auswertung von dichotomen Kriteriumsvariablen in binären logistischen Regressionsanalysen (Rudolf und Buse, 2020) oder bei der Analyse von mehrstufigen kategorialen oder ordinalen Zielgrößen in multinomialen logistischen (Kapitel 4) bzw. ordinalen (Kapitel 5) Regressionsanalysen. In diesem Kapitel sollen die Grundlagen verallgemeinerter linearer Modelle am Beispiel von in der Anwendung häufig auftretenden Verteilungen metrischer Kriteriumsvariablen dargestellt werden. Dabei handelt es sich um die Poisson-Verteilung (Kapitel 1.3.1 und 1.3.2) als diskrete Verteilung der Anzahl von Ereignissen wie zum Beispiel Fehlerzahlen bei einfachen Aufgaben sowie um die Gammaverteilung (Kapitel 1.3.3), die sich als linkssteile stetige Verteilung zum Beispiel zur Modellierung von Reaktionszeiten in psychologischen Untersuchungen anbietet. Einführungen in die Theorie und die Anwendung verallgemeinerter linearer Modelle geben zum Beispiel Agresti (2013), Cohen et al. (2003), Colver und Holling (2009), Dobson und Barnett (2018), Fox (2015), McCullagh und Nelder (1989), Nelder und Wedderburn (1972) sowie Tutz und Strobl (2009). Die mit verallgemeinerten linearen Modellen zu bearbeitenden Fragestellungen unterscheiden sich nicht von den Fragestellungen im Rahmen multipler Regressionsanalysen. Allgemeines Ziel ist die Untersuchung des Einflusses eines oder mehrerer Prädiktoren und von deren Interaktionen auf eine Kriteriumsvariable, deren Verteilung diskret oder kontinuierlich sein kann und nicht der Normalverteilung entsprechen muss. Mögliche Fragestellungen bzw. Ziele der Analyse sind unter anderem: Untersuchung der Wirksamkeit einzelner Prädiktoren im untersuchten Modell, Beurteilung der Güte des untersuchten Modells, Identifikation redundanter Prädiktoren, Suche nach optimalen Merkmalsmengen. |15|In Kapitel 1.2 werden die Grundlagen verallgemeinerter linearer Modelle beschrieben. Nach einer ausführlichen Beschreibung der Komponenten Verteilung, Linkfunktion und Linearkombination werden die Prinzipien der Parameterschätzung und der Gütebeurteilung verallgemeinerter linearer Modelle dargestellt. Die Anwendungsbeispiele in Kapitel 1.3 beinhalten die Poisson-Regression zur Vorhersage der Anzahl von Rechen- bzw. Lesefehlern bei dichotomem bzw. bei metrischem Prädiktor sowie die Gamma-Regression zur Analyse von Reaktionszeiten bei zwei Prädiktoren unter Berücksichtigung ihrer Interaktion. 1.2 Grundlagen verallgemeinerter linearer Modelle
Beispiele für Vorgehensweisen auf der Grundlage des allgemeinen linearen Modells sind der t-Test, die multiple lineare Regressionsanalyse oder die Varianzanalyse (zur Illustration siehe Abbildung 1.1; siehe zum Vergleich Abbildung 1.2). Das allgemeine lineare Modell kann durch folgende Beziehungen dargestellt werden (vgl. Rudolf und Buse, 2020): (1.1) yi: Wert der Kriteriumsvariablen Y der i-ten Versuchsperson x1i, x2i, ..., xki: Werte der Prädiktorvariablen X1, X2, ..., Xk der i-ten Versuchsperson ei: Residuum der i-ten Versuchsperson b0, b1, ..., bk: Regressionskoeffizienten n: Anzahl der Versuchspersonen |16|Der Erwartungswert der Kriteriumsvariablen Yi in Abhängigkeit von gegebenen Werten der Variablen X1, X2, …, Xk ergibt sich im ALM entsprechend als (1.2) Y1, Y2, …, Yn: unabhängige, normalverteilte Zufallsvariablen µYi: Erwartungswert von Yi x1i, x2i, …, xki: Werte der Prädiktorvariablen X1, X2, …, Xk der i-ten Versuchsperson b0, b1, ..., bk: Regressionskoeffizienten Ei: Modellfehler mit E(Ei) = 0 Die Anwendung des allgemeinen linearen Modells einschließlich der Tests hat mehrere Voraussetzungen (vgl. Backhaus et al., 2018; Cohen et al., 2003): Linearer Zusammenhang zwischen Prädiktoren und metrischem Kriterium, Unkorrelierte Modellfehler (Residuen), Modellfehler unterliegen einer Normalverteilung ?(0, s2), Verteilung der Modellfehler unabhängig von den Prädiktoren, Homoskedastizität: Varianz der Modellfehler (Residuen) ist unabhängig von den Ausprägungen der Prädiktoren. In den später beschriebenen Anwendungsbeispielen dieses Kapitels werden Kriteriumsvariablen untersucht, die nicht normalverteilt sind bzw. kein metrisches Datenniveau aufweisen. Damit ist die Anwendung des allgemeinen linearen Modells nicht angemessen. Demgegenüber bieten verallgemeinerte lineare Modelle |17|in derartigen Fällen adäquate und sachgerechte Auswertungsmöglichkeiten. Sie bestehen grundsätzlich aus drei Bestimmungsgrößen: einer Verteilung, einer Linearkombination und einer Linkfunktion (Tutz und Strobl, 2009). Bei der Verteilungskomponente verallgemeinerter linearer Modelle handelt es sich um eine statistische Verteilung, die der Verteilung der Messwerte der Kriteriumsvariablen entspricht (Abschnitt 1.2.1). Das verallgemeinerte lineare Modell beinhaltet analog zum allgemeinen linearen Modell die lineare Verknüpfung der Prädiktoren. Eine Linkfunktion (Abschnitt 1.2.2) ist zur Verknüpfung der Kriteriumsvariablen mit der Linearkombination der Prädiktoren notwendig. In Abschnitt 1.2.3 werden grundlegende Überlegungen zu Schätzmethoden, Tests und Parametern der Modellgüte in verallgemeinerten linearen Modellen einführend beschrieben. Da in verallgemeinerten linearen Modellen eine Vielzahl von Verteilungen und unterschiedlichen Linkfunktionen verknüpft werden können, gibt es sehr viele verschiedene spezielle Modelle. Neben den in diesem Kapitel exemplarisch behandelten Verfahren der Poisson- und der Gamma-Regression gehören dazu auch die in diesem Buch in separaten Kapiteln behandelten Verfahren...