E-Book, Deutsch, 294 Seiten
Reihe: Springer-Lehrbuch
Toutenburg / Heumann Deskriptive Statistik
4. Auflage 2004
ISBN: 978-3-540-34999-0
Verlag: Springer Berlin Heidelberg
Format: PDF
Kopierschutz: 1 - PDF Watermark
Eine Einführung mit Übungsaufgaben und Beispielen mit SPSS
E-Book, Deutsch, 294 Seiten
Reihe: Springer-Lehrbuch
ISBN: 978-3-540-34999-0
Verlag: Springer Berlin Heidelberg
Format: PDF
Kopierschutz: 1 - PDF Watermark
Statistische Verfahren werden in der Wirtschaft, in den Natur- und Sozialwissenschaften eingesetzt. Die Statistik gilt trotzdem als schwierig. Um diese Hemmschwelle zu überwinden, geben die Autoren eine didaktisch ausgefeilte, anwendungsbezogene Einführung in die Methoden der deskriptiven Statistik und Datenanalyse.
Anhand praxisnaher Beispiele beschreiben sie die Ideen des Datenmanagements und der Datenauswertung unter Einsatz von SPSS. Viele Übungsaufgaben (mit Lösungen) unterstützen das (Selbst-) Studium der Leser. Das Buch deckt den Stoff Statistik I an deutschsprachigen Universitäten vollständig ab.
In dieser 5. Auflage neu und - für diesen Leserkreis - konkurrenzlos sind die Kurzeinführung in die praktische Handhabung von SPSS, die Einführung in die Methoden zur Behandlung fehlender bzw. unvollständiger Daten, Maße und Modelle für das Rater-Agreement sowie explorative Grafiken für mehrere Variablen.
Geschrieben für:
Studenten
Schlagworte:
Beschreibende Statistik
Datananalyse
Deskriptive Statistik
SPSS
Statistik
Autoren/Hrsg.
Weitere Infos & Material
1;Vorwort;5
2;Inhaltsverzeichnis;7
3;1. Grundlagen;10
3.1;1.1 Grundgesamtheit und Untersuchungseinheit;10
3.2;1.2 Merkmal oder statistische Variable;11
3.3;1.3 Datenerhebung;16
3.4;1.4 Datenaufbereitung;22
3.5;1.5 Aufgaben und Kontrollfragen;27
4;2. Haufigkeitsverteilungen;30
4.1;2.1 Absolute und relative Haufigkeiten;30
4.2;2.2 Empirische Verteilungsfunkt ion;34
4.3;2.3 Grafische Darstellung;39
4.3.1;2.3.1 Stab- oder Balkendiagramme;40
4.3.2;2.3.2 Kreisdiagramme;40
4.3.3;2.3.3 Stamm-und-Blatt-Diagramme;40
4.3.4;2.3.4 Histogramme;44
4.3.5;2.3.5 Kerndichteschatzer;45
4.4;2.4 Aufgaben und Kontrollfragen;47
5;3. Maßzahlen für eindimensionale Merkmale;52
5.1;3.1 Lagemaße;52
5.1.1;3.1.1 Modus oder Modalwert;53
5.1.2;3.1.2 Median und Quantile;55
5.1.3;3.1.3 Quantil-Quantil-Diagramme (Q-Q-Plots);60
5.1.4;3.1.4 Arithmetisches Mittel;62
5.1.5;3.1.5 Geometrisches Mittel;68
5.1.6;3.1.6 Harmonisches Mittel;72
5.2;3.2 Streuungsmaße;75
5.2.1;3.2.1 Spannweite und Quartilsabstand;76
5.2.2;3.2.2 Mittlere absolute Abweichung vom Median;77
5.2.3;3.2.3 Varianz und Standardabweichung;78
5.2.4;3.2.4 Variationskoeffizient;83
5.3;3.3 Schiefe und Wolbung;84
5.3.1;3.3.1 Schiefe;84
5.3.2;3.3.2 Wolbung;85
5.4;3.4 Box-Plots;86
5.5;3.5 Konzentrationsmaße;87
5.5.1;3.5.1 Lorenzkurven;89
5.5.2;3.5.2 Gini-Koeffizient;90
5.5.3;3.6 Aufgaben und Kontrollfragen;94
6;4. Maßzahlen für den Zusammenhang zweier Merkmale;100
6.1;4.1 Darstellung der Verteilung zweidimensionaler Merkmale;100
6.1.1;4.1.1 Kontingenztafeln bei diskreten Merkmalen;100
6.1.2;4.1.2 Grafische Darstellung bei diskreten Merkmalen;104
6.1.3;4.1.3 Maßzahlen zur Beschreibung der Verteilung bei stetigen und gemischt stetig-diskreten Merkmalen;106
6.1.4;4.1.4 Grafische Darstellung der Verteilung stetiger bzw. gemischt stetig-diskreter Merkmale;108
6.2;4.2 Maßzahlen fiir den Zusammenhang zweier nominaler Merkmale;110
6.2.1;4.2.1 Pearsons X2-Statistik;112
6.2.2;4.2.2 Phi-Koeffizient;115
6.2.3;4.2.3 KontingenzmaB von Cramer;117
6.2.4;4.2.4 Kontingenzkoeffizient C;118
6.2.5;4.2.5 Lambda-Mafie;119
6.2.6;4.2.6 Der Yule-Koeffizient;121
6.2.7;4.2.7 Der Odds-Ratio;123
6.3;4.3 Maßzahlen fiir den Zusammenhang ordinaler Merkmale;125
6.3.1;4.3.1 Gamma;126
6.3.2;4.3.2 Kendalls tau-b und Stuarts tau-c;128
6.3.3;4.3.3 Rangkorrelationskoeffizient von Spearman;129
6.4;4.4 Zusammenhang zwischen zwei stetigen Merkmalen;133
6.5;4.5 Aufgaben und Kontrollfragen;140
7;5. Zweidimensionale quantitative Merkmale: Lineare Regression;144
7.1;5.1 Einleitung;144
7.2;5.2 Plots und Hypothesen;146
7.3;5.3 Prinzip der kleinsten Quadrate;148
7.3.1;5.3.1 Bestimmung der Schatzungen;150
7.3.2;5.3.2 Herleitung der Kleinste-Quadrate-Schätzungen;150
7.3.3;5.3.3 Eigenschaften der Regressionsgeraden;152
7.4;5.4 Giite der Anpassung;156
7.4.1;5.4.1 Varianzanalyse;156
7.4.2;5.4.2 Korrelation;159
7.5;5.5 Residualanalyse;164
7.6;5.6 Lineare Transformat ion der Originaldaten;164
7.7;5.7 Multiple lineare Regression und nicht lineare Regression;166
7.8;5.8 Polynomiale Regression;168
7.9;5.9 Lineare Regression mit kategorialen Regressoren;170
7.10;5.10 Spezielle nichtlineare Modelle - Wachstumskurven;174
7.11;5.11 Aufgaben und Kontrollfragen;175
8;6. Zeitreihen;180
8.1;6.1 Kurvendiagramme;180
8.2;6.2 Zerlegung von Zeitreihen;181
8.3;6.3 Fehlende Werte, äquidistante Zeitpunkte;182
8.4;6.4 Gleitende Durchschnitte;182
8.5;6.5 Saisonale Komponente, konstante Saisonfigur;184
8.6;6.6 Model1 fiir den linearen Trend;188
8.7;6.7 Aufgaben und Kontrollfragen;190
9;7. Verhaltniszahlen und Indizes;192
9.1;7.1 Einleitung;192
9.2;7.2 Einfache Indexzahlen;194
9.2.1;7.2.1 Veranderung des Basisjahres;195
9.3;7.3 Preisindizes;197
9.3.1;7.3.1 Preisindex nach Laspeyres;198
9.3.2;7.3.2 Preisindex nach Paasche;199
9.4;7.4 Mengenindizes;200
9.4.1;7.4.1 Laspeyres-Mengenindex;201
9.4.2;7.4.2 Paasche-Mengenindex;201
9.5;7.5 Umsatzindizes (Wertindizes);201
9.6;7.6 Verkniipfung von Indizes;202
9.7;7.7 Spezielle Probleme der Indexrechnung;204
9.7.1;7.7.1 Erweiterung des Warenkorbs;204
9.7.2;7.7.2 Substitution einer Ware;205
9.7.3;7.7.3 Subindizes;206
9.8;7.8 Standardisierung von Raten und Quoten;208
9.8.1;7.8.1 Datengestaltung fiir die Standardisierung von Raten;211
9.8.2;7.8.2 Indirekte Methode der Standardisierung;211
9.8.3;7.8.3 Direkte Standardisierung;215
9.9;7.9 Ereignisanalyse;218
9.9.1;7.9.1 Problemstellung;218
9.9.2;7.9.2 Grundbegriffe der Lebensdaueranalyse;221
9.9.3;7.9.3 Ernpirische Hazardrate und ~berlebensrate;223
10;Lösungen zu den Übungsaufgaben;232
11;Literatur;290
12;Sachverzeichnis;292
1.3 Datenerhebung (S. 7-8)
Wenn wir anhand der Fragestellung die Grundgesamtheit und die Untersuchungseinheiten definiert haben und die fur die Fragestellung interessierenden Merkmale ausgewahlt sind, ist im nachsten Schritt zu klaren, wie die benötig-te Information uber die Untersuchungseinheiten beschafft werden soll. Die Beschaffung der Information bzw. die Gewinnung der Daten wird als Erhebung bezeichnet. Da die Qualitat der aus der statistischen Analyse resultierenden Aussagen wesentlich von der Qualitat der erhobenen Daten abhangt, sollte bereits bei der Konzeption der Datenbeschaffung berucksichtigt werden, welche statistischen Methoden zur Beantwortung der Fragestellung herangezogen werden konnen. Bei der Planung der Datenerhebung stellen sich zunächst die beiden folgenden Fragen:
* Wie werden die Daten erhoben?
* Wieviele Untersuchungseinheiten werden benotigt?
Der zweite Aspekt betrifft die Grofie der Erhebung. Werden alle Unter- suchungseinheiten der Grundgesamtheit erhoben, so spricht man von einer Totalerhebung. Ein Beispiel hierfur ist die Volkszahlung. Durch eine To- talerhebung erhalten wir eine vollstandige Information uber die Grundge- samtheit, mogliche Unsicherheiten aufgrund fehlender Informationen sind somit ausgeschlossen.
Das Problem einer Totalerhebung liegt jedoch meist darin, dass es nur selten moglich ist, alle Untersuchungseinheiten zu erheben. Dies kann zum einen daran liegen, dass Untersuchungseinheiten die Erhebung verweigern, oder aber dass eine Totalerhebung aus logistischen Grunden oder aufgrund eines beschrankten Budgets nicht moglich ist. Daher werden meist nur die Merkmale fur einen Teil der Grundgesamtheit - eine Stichprobe - erhoben. Die Auswahl der Untersuchungseinheiten, die in die Stichprobe gelangen, muss fur die Grundgesamtheit reprasentativ sein. Weiterhin hangt die Qualitat der statistischen Analyse auch von der Anzahl der erhobenen Untersuchungseinheiten - dem Stichprobenumfang - ab. Diese Probleme sind Inhalt der Stichprobentheorie, auf die wir im Rahmen der deskriptiven Statistik nicht weiter eingehen wollen. Der interessierte Leser sei beispielsweise auf Stenger (1986) verwiesen. Meist werden die fur die Fragestellung benotigten Informationen direkt erhoben, d. h., die Datenerhebung wird als
* Befragung,
* Beobachtung,
* Experiment
durchgeführt. Diese Art der Datenerhebung wird als Primarerhebung bezeichnet. Alternativ konnen wir aber auch auf die Daten aus anderen Er- hebungen zu ahnlichen Fragestellungen, auf in der Literatur veroffentlichte Daten oder auf Daten aus anderen Quellen zugreifen. Dies bezeichnet man als Sekundarerhebung. Fur welche Art der Datenerhebung man sich entschei- det, hangt vom zur Verfugung stehenden Budget, dem Zeitaufwand und der Anwendbarkeit ab.
Die Verwendung der Daten aus Sekundarerhebungen ist zwar kostengunstig, kann aber sehr zeitaufwendig sein. Weiter muss die Sekundarstatistik auf der gleichen Grundgesamtheit beruhen, die Definition der Merkmale muss ubereinstimmen und die Auswahl der Untersuchungseinheiten muss passend sein. Dies schränkt die Verwendbarkeit von Sekundarstatistiken bei der Datenerhebung haufig ein. Die Wahl zwischen Befragung, Beobachtung und Experiment hangt ebenfalls vom zur Verfugung stehenden Budget und vom Zeitaufwand ab.
Daneben spielt aber vor allem das Fachgebiet, aus dem die Fragestellung kommt, eine wichtige Rolle. So uberwiegen Beobachtung und Experiment in Naturwissenschaft und Technik, wahrend in den Wirtschafts- und Sozialwissenschaften meist Befragungen durchgefuhrt werden. Wir beschreiben im folgenden kurz diese drei Erhebungstechniken. Eine ausführliche Darstellung und praktische Anleitung findet man 2.B. in Schnell, Hill und Esser (1992.




