Handbuch der sozialwissenschaftlichen Datenanalyse
von: Christof Wolf, Henning Best
VS Verlag für Sozialwissenschaften (GWV), 2011
ISBN: 9783531920382
Sprache: Deutsch
1083 Seiten, Download: 7794 KB
Format: PDF, auch als Online-Lesen
Vorwort | 5 | ||
Inhaltsverzeichnis | 6 | ||
Teil I Einführung | 10 | ||
1 Einführung: Sozialwissenschaftliche Datenanalyse | 11 | ||
1 Moderne Sozialwissenschaft und die Bedeutung der Statistik | 11 | ||
2 Ziele und Zielgruppe des Handbuchs | 12 | ||
3 Themenauswahl | 13 | ||
4 Gliederung und Inhal | 14 | ||
5 Ausblick | 14 | ||
Literaturverzeichnis | 15 | ||
2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik | 16 | ||
1 Einführung | 16 | ||
2 Was heißt Kausalität? | 17 | ||
2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität | 18 | ||
2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen | 18 | ||
2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität | 18 | ||
2.4 Kausalität als „Mechanismus“ | 19 | ||
2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn? | 19 | ||
2.6 Exkurs: Die Logik der Erklärung | 20 | ||
2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität | 21 | ||
2.8 Zum Vergleich der Kausalitäts-Definitionen | 23 | ||
3 Kausalität in sozialwissenschaftlichen Experimenten | 24 | ||
4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression | 27 | ||
4.1 Enthalten Kausalmodelle Kausalaussagen? | 27 | ||
4.2 Regressionsanalyse und kausale Schlüsse | 28 | ||
4.3 Kausalität in anderen multivariaten Verfahren | 33 | ||
4.4 Gibt es Algorithmen für die Ermittlung von Kausalität? | 34 | ||
5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen | 36 | ||
6 Kausalität in Messmodellen | 38 | ||
7 Resümee | 41 | ||
8 Literaturempfehlungen | 41 | ||
Literaturverzeichnis | 42 | ||
Teil II Grundlagen der Datenanalyse | 46 | ||
3 Datengewinnung und Datenaufbereitung | 47 | ||
1 Daten | 47 | ||
2 Formen der Datenerhebung | 49 | ||
2.1 Befragung | 49 | ||
Persönlich-Mündliches Interview | 53 | ||
Schriftliche Befragung | 54 | ||
Telefonbefragung | 56 | ||
Onlinebefragungen | 57 | ||
Entscheidung für eine Befragungsform | 60 | ||
2.2 Beobachtung | 61 | ||
3 Stichprobenziehung | 63 | ||
4 Datenaufbereitung | 66 | ||
4.1 Transkription | 66 | ||
4.2 Kodierung | 66 | ||
4.3 Plausibilisierung | 67 | ||
4.4 Gewichtung | 68 | ||
4.5 Archivierung | 68 | ||
5 Literaturempfehlungen | 69 | ||
Literaturverzeichnis | 69 | ||
4 Uni- und bivariate deskriptive Statistik | 71 | ||
1 Univariate Statistik | 71 | ||
1.1 Lagemaße | 71 | ||
Arithmetische Mittel | 71 | ||
Median (Zentralwert) | 72 | ||
Modalwert | 74 | ||
1.2 Streuungsmaße | 74 | ||
Varianz, Standardabweichung und Variationskoeffizient | 75 | ||
Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung | 77 | ||
Index qualitativer Variation | 78 | ||
1.3 Schiefe | 78 | ||
2 Bivariate Statistik | 79 | ||
2.1 Tabellenanalyse | 81 | ||
Spalten-, Zeilen- und Gesamtprozente | 81 | ||
Prozentuierung und statistische Unabhängigkeit | 82 | ||
Prozentsatzdifferenz | 83 | ||
Odds und Odds-Ratio | 84 | ||
Nominalskalierte Maße: Cramérs V | 85 | ||
Ordinalskalierte Merkmale | 87 | ||
2.2 Metrische Merkmale: Kovarianz und Korrelation | 91 | ||
3 Ausblick | 94 | ||
4 Literaturempfehlungen | 94 | ||
Literaturverzeichnis | 94 | ||
5 Graphische Datenexploration | 96 | ||
1 Einführung | 96 | ||
2 Graphische Methoden für die Datenexploration | 98 | ||
2.1 Einteilungskriterien für graphische Darstellungen | 98 | ||
2.2 Univariate Analysen | 99 | ||
Untersuchung der empirischen Häufigkeitsverteilung | 99 | ||
Vergleich von Verteilungen | 108 | ||
Die Darstellung von Zeitreihen | 112 | ||
2.3 Bivariate Analysen | 113 | ||
Das Anscombe-Quartett | 114 | ||
Streudiagramm | 115 | ||
2.4 Multivariate Analysen | 117 | ||
3 Fehlervermeidung und Hinweise zum praktischen Vorgehen | 119 | ||
4 Literaturempfehlungen | 120 | ||
Anhang | 120 | ||
Literaturverzeichnis | 121 | ||
6 Der Umgang mit fehlenden Werten | 122 | ||
1 Einführung in Techniken zur Kompensation fehlender Werte | 122 | ||
1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit | 122 | ||
1.2 Gewichtung | 125 | ||
Schätzung der Responsewahrscheinlichkeiten | 126 | ||
Gewichten oder nicht? | 127 | ||
Ergänzungen | 128 | ||
1.3 Multiple Imputation | 129 | ||
Voraussetzungen | 129 | ||
Erzeugung multipler Imputationen | 130 | ||
Auswertung multipel imputierter Datensätze | 132 | ||
Ergänzungen | 133 | ||
2 Mathematisch-statistische Grundlagen | 134 | ||
2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit | 134 | ||
2.2 Gewichtung | 135 | ||
2.3 Multiple Imputation | 137 | ||
3 Beispiel: Einkommensgleichung mit fehlenden Werten | 140 | ||
4 Häufige Fehler | 144 | ||
5 Literaturempfehlungen | 146 | ||
Literaturverzeichnis | 147 | ||
7 Gewichtung | 148 | ||
1 Einführung in das Verfahren | 148 | ||
2 Mathematisch-statistische Grundlagen | 150 | ||
2.1 Designgewichtung in komplexen Stichprobenerhebungen | 152 | ||
Schichtung | 153 | ||
Proportionale Aufteilung | 154 | ||
Disproportionale Schichtung | 154 | ||
Klumpenauswahl | 155 | ||
Auswahl mit ungleichen Wahrscheinlichkeiten | 156 | ||
2.2 Kombination von Anpassungs- und Designgewichtung | 158 | ||
3 Gewichtung am Beispiel des ESS | 163 | ||
4 Häufige Fehler | 168 | ||
5 Literaturempfehlungen | 168 | ||
Literaturverzeichnis | 168 | ||
8 Grundlagen des statistischen Schließens | 170 | ||
1 Einführung in die Fragestellung | 170 | ||
2 Statistisches Schätzen | 171 | ||
2.1 Eigenschaften von Schätzern | 172 | ||
2.2 Intervallschätzung | 175 | ||
3 Statistisches Testen | 179 | ||
3.1 Hypothesentests über Konfidenzintervalle | 179 | ||
3.2 Signifikanztests | 180 | ||
3.3 Berücksichtigung der Trennschärfe von Tests | 183 | ||
3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests | 185 | ||
4 Anwendungsfehler und Anwendungsprobleme | 187 | ||
4.1 Fallzahlabhängigkeit | 188 | ||
4.2 Spezifikation der statistischen Fragestellung | 189 | ||
4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse | 190 | ||
Interpretation von Konfidenzintervallen | 190 | ||
Interpretation von Signifikanzen | 190 | ||
Formulierung der Forschungshypothese als Alternativhypothese | 191 | ||
Multiples Testen | 191 | ||
Modell-Fitting | 192 | ||
Stichprobenpläne als Quelle von Interpretationsfehlern | 193 | ||
5 Literaturhinweise | 193 | ||
Literaturverzeichnis | 194 | ||
9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap | 195 | ||
1 Einführung in das Verfahren | 195 | ||
2 Mathematisch-statistische Grundlagen | 199 | ||
2.1 Standardfehler und Konfidenzintervall von ˆ? | 199 | ||
Normale Approximationsmethode | 200 | ||
Perzentil-Methode | 200 | ||
Bias-corrected and accelerated Methode (BCa) | 200 | ||
2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten | 202 | ||
3 Ein Beispiel | 203 | ||
3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation | 205 | ||
4 Häufige Fehler | 206 | ||
5 Literaturempfehlungen | 208 | ||
Literaturverzeichnis | 208 | ||
10 Maximum-Likelihood Schätztheorie | 209 | ||
1 Einführung in das Verfahren | 210 | ||
2 Die Mechanik des Maximum-Likelihood Verfahrens | 212 | ||
2.1 Das ML-Verfahren zur Bestimmung eines Parameters | 213 | ||
2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter | 218 | ||
3 Statistische Eigenschaften der ML-Schätzer | 223 | ||
4 Inferenzstatistik und Modellanpassung | 226 | ||
4.1 Test auf Signifikanz individueller Parameter | 227 | ||
4.2 Test auf Signifikanz mehrerer Parameter | 228 | ||
Likelihood Ratio Test | 228 | ||
Wald-Test | 229 | ||
Lagrange Multiplikatortest | 230 | ||
4.3 Modellgüte | 231 | ||
McFadden R2 | 232 | ||
Wald- und LM-basierte R2 | 233 | ||
AIC und BIC | 234 | ||
5 Numerische Optimierungsverfahren | 235 | ||
6 Literaturempfehlungen | 237 | ||
Literaturverzeichnis | 238 | ||
Teil III Messen und Skalieren | 240 | ||
11 Reliabilität, Validität, Objektivität | 241 | ||
1 Einführung | 241 | ||
2 Objektivität | 242 | ||
2.1 Durchführungsobjektivität | 242 | ||
2.2 Auswertungsobjektivität | 243 | ||
2.3 Interpretationsobjektivität | 244 | ||
3 Reliabilität | 244 | ||
3.1 Retest-Reliabilität | 246 | ||
Beispiel zur Bestimmung der Retest-Reliabilität | 247 | ||
3.2 Die Paralleltest-Reliabilität | 247 | ||
3.3 Die Split-Half-Reliabilität | 248 | ||
Beispiel zur Bestimmung der Split-Half-Reliabilität | 249 | ||
3.4 Konsistenzanalysen | 250 | ||
Beispiel zur Bestimmung der internen Konsistenz | 250 | ||
3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten | 251 | ||
4 Validität | 252 | ||
4.1 Die Inhaltsvalidität | 252 | ||
4.2 Kriteriumsvalidität | 253 | ||
4.3 Konstruktvalidität | 255 | ||
Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität) | 255 | ||
Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten | 256 | ||
Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil | 257 | ||
5 Vorgehen zur Güteüberprüfung von Skalen | 258 | ||
6 Häufige Fehler | 259 | ||
7 Literaturempfehlungen | 259 | ||
Literaturverzeichnis | 260 | ||
12 Thurstone- und Likertskalierung | 261 | ||
1 Einleitung | 261 | ||
2 Thurstone Skalierung | 262 | ||
2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ) | 262 | ||
Grundlagen des Verfahrens | 262 | ||
Vorgehensweise bei der Skalierung | 264 | ||
Anwendungsbeispiel | 266 | ||
2.2 Die Methode der gleich erscheinenden Intervalle | 270 | ||
2.3 Die Methode der sukzessiven Intervalle (MSI) | 272 | ||
Grundlagen des Verfahrens | 272 | ||
Anwendungsbeispiel | 273 | ||
2.4 Häufige Fehler bei der Thurstone Skalierung | 277 | ||
3 Likertskalierung | 277 | ||
3.1 Grundlagen des Verfahrens | 277 | ||
3.2 Anwendungsbeispiel | 279 | ||
3.3 Häufige Fehler bei der Likert Skalierung | 282 | ||
4 Literaturempfehlungen | 282 | ||
Literaturverzeichnis | 282 | ||
13 Guttman- und Mokkenskalierung | 284 | ||
1 Einleitung | 284 | ||
2 Guttmanskalierung | 286 | ||
2.1 Grundlagen des Verfahrens | 286 | ||
Modellannahmen | 288 | ||
Schätzung von Item- und Personenparametern | 289 | ||
Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern | 290 | ||
Modellprüfung | 291 | ||
2.2 Anwendungsbeispiel | 297 | ||
2.3 Häufige Fehler bei der Guttmanskalierung | 299 | ||
3 Mokkenskalierung | 300 | ||
3.1 Grundlagen des Verfahrens | 300 | ||
Modellprüfung | 302 | ||
3.2 Anwendungsbeispiel | 306 | ||
3.3 Häufige Fehler bei der Mokkenskalierung | 308 | ||
4 Literaturempfehlungen | 308 | ||
Literaturverzeichnis | 309 | ||
14 Item-Response-Theorie | 311 | ||
1 Einführung | 312 | ||
2 Modelle für dichotome Items | 313 | ||
2.1 Das Rasch-Modell | 313 | ||
2.2 Das Birnbaum-Modell | 316 | ||
2.3 Das Modell mit Rateparameter | 317 | ||
3 Modelle für mehrstufig geordnete Items | 318 | ||
3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell) | 318 | ||
3.2 Weitere IRT-Modelle für ordinale Items | 320 | ||
4 Weitere IRT-Modelle | 321 | ||
4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell | 321 | ||
5 Modelltestung und Modellvergleiche | 322 | ||
6 Beispielanwendung | 324 | ||
6.1 Anwendung 1: Kompetenzmessung | 324 | ||
6.2 Anwendung 2: Surveyforschung | 326 | ||
7 Häufige Fehler | 330 | ||
8 Literaturempfehlungen | 331 | ||
Literaturverzeichnis | 331 | ||
15 Hauptkomponentenanalyse und explorative Faktorenanalyse | 333 | ||
1 Einführung in das Verfahren | 333 | ||
1.1 Einsatzmöglichkeiten | 333 | ||
1.2 Die Hauptkomponentenanalyse | 336 | ||
Eine geometrische Perspektive | 336 | ||
Die konkreten Schritte der PCA | 340 | ||
Bestimmung der Komponentenzahl | 341 | ||
Die unrotierte Lösung | 343 | ||
Rotation | 344 | ||
Berechnung von Komponentenwerten | 347 | ||
1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne | 348 | ||
2 Mathematisch-statistische Grundlagen | 350 | ||
3 Ein Anwendungsbeispiel: Vertrauen in Institutionen | 354 | ||
4 Probleme und Erweiterungen | 360 | ||
5 Literaturempfehlungen | 363 | ||
Anhang | 364 | ||
Literaturverzeichnis | 364 | ||
16 Korrespondenzanalyse | 366 | ||
1 Einleitung | 366 | ||
2 Mathematisch-statistische Grundlagen | 368 | ||
3 Ein Beispiel | 370 | ||
3.1 Graphische Darstellung | 370 | ||
3.2 Numerische Darstellung | 373 | ||
4 Erweiterungen der Korrespondenzanalyse | 376 | ||
4.1 Zusammengesetzte Tabellen | 376 | ||
4.2 Multiple Korrespondenzanalyse | 378 | ||
4.3 Aktive und passive Merkmale | 382 | ||
4.4 Andere Datenformate | 384 | ||
5 Häufige Fehler | 385 | ||
6 Diskussion | 386 | ||
7 Literaturempfehlungen | 386 | ||
Literaturverzeichnis | 387 | ||
17 Multidimensionale Skalierung | 389 | ||
1 Einführung in die MDS | 389 | ||
1.1 Die MDS als psychologisches Modell | 390 | ||
1.2 Die MDS zur Exploration von Datenstrukturen | 392 | ||
2 Mathematische Grundlagen der MDS | 393 | ||
2.1 Güte einer MDS-Lösung | 393 | ||
2.2 Bewertung des Stress | 395 | ||
2.3 MDS-Modelle | 397 | ||
2.4 MDS-Algorithmen | 400 | ||
2.5 Konfirmatorische MDS | 400 | ||
3 Häufige Fehler | 403 | ||
3.1 Degenerierte Lösungen in der ordinalen MDS | 403 | ||
3.2 Falsche Polung der Proximitäten | 405 | ||
3.3 Fehlbewertung von Stress | 406 | ||
3.4 Fehler beim Vergleich verschiedener MDS-Lösungen | 407 | ||
3.5 Mechanische Interpretation „der“ Dimensionen | 409 | ||
3.6 Behandlung störender Punkte | 412 | ||
3.7 Überinterpretation von Dimensionsgewichten | 413 | ||
4 Literaturempfehlungen | 413 | ||
Anhang | 414 | ||
Literaturverzeichnis | 415 | ||
Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen | 417 | ||
18 Analyse kategorialer Daten | 418 | ||
1 Einführung in das Verfahren | 418 | ||
2 Mathematisch-statistische Grundlagen | 430 | ||
3 Ein Beispiel | 440 | ||
4 Häufige Fehler | 448 | ||
5 Literaturempfehlungen | 450 | ||
Literaturverzeichnis | 450 | ||
19 Varianz- und Kovarianzanalyse | 452 | ||
1 Einführung in das Verfahren | 452 | ||
1.1 Vergleich von zwei Gruppen | 454 | ||
Modellgleichung | 455 | ||
Hypothesen | 455 | ||
Quadratsummen | 456 | ||
Freiheitsgrade | 457 | ||
Allgemeine Teststatistik | 457 | ||
Annahmen | 459 | ||
Exkurs: Mittlere Quadratsummen | 460 | ||
1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse | 461 | ||
1.3 Mehrfaktorielle Varianzanalyse | 462 | ||
Modellgleichung | 462 | ||
Hypothesen | 463 | ||
Quadratsummen | 463 | ||
Freiheitsgrade | 464 | ||
Teststatistik | 465 | ||
Annahmen | 465 | ||
1.4 Kovarianzanalyse | 466 | ||
Modellgleichung | 467 | ||
ANOVA versus ANCOVA | 467 | ||
1.5 Effektstärke | 468 | ||
1.6 Teststärke | 471 | ||
2 Mathematisch-statistische Grundlagen | 472 | ||
2.1 ANOVA und ANCOVA als Spezialfälle des ALM | 473 | ||
2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM | 477 | ||
3 Ein Beispiel | 480 | ||
3.1 Vergleich von zwei Gruppen | 480 | ||
3.2 Vergleich von mehr als zwei Gruppen | 481 | ||
3.3 Mehrfaktorielle ANOVA | 482 | ||
3.4 Kovarianzanalyse | 484 | ||
3.5 Annahmen der Varianz- und Kovarianzanalyse | 484 | ||
3.6 Teststärke | 488 | ||
4 Häufige Fehler – eine Checkliste | 488 | ||
5 Literaturempfehlungen | 489 | ||
Literaturverzeichnis | 489 | ||
20 Diskriminanzanalyse | 491 | ||
1 Einführung in das Verfahren | 491 | ||
1.1 Zielsetzung und Anwendungsmöglichkeiten | 491 | ||
1.2 Problemstellung und Prämissen | 493 | ||
1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren | 495 | ||
1.4 Vorgehensweise | 497 | ||
Festlegung des Untersuchungsdesigns | 497 | ||
Extraktion der Diskriminanzfunktion(en) | 498 | ||
Evaluation der Diskriminanzfunktion(en) | 500 | ||
Merkmalsselektion und Klassifikation neuer Objekte | 502 | ||
2 Mathematisch-statistische Grundlagen | 503 | ||
2.1 Ermittlung der Diskriminanzfunktion (en) | 503 | ||
2.2 Prüfkriterien der Diskriminanz | 507 | ||
2.3 Klassifikationskonzepte | 508 | ||
Distanzkonzept | 509 | ||
Wahrscheinlichkeitskonzept | 510 | ||
Konzept der Klassifikationsfunktionen nach Fisher | 510 | ||
3 Anwendungsbeispiel | 511 | ||
4 Häufige Fehler | 515 | ||
5 Literaturempfehlungen | 517 | ||
Literaturverzeichnis | 518 | ||
21 Clusteranalyse | 520 | ||
1 Einführung in das Verfahren | 520 | ||
1.1 Was ist Clusteranalyse und was sind überhaupt Cluster? | 521 | ||
1.2 Clusterstruktur | 522 | ||
1.3 Algorithmen | 522 | ||
1.4 Variablenräume | 523 | ||
1.5 Agglomerative Verfahren | 524 | ||
Ähnlichkeitsmaß, Distanz und Index | 524 | ||
Fusionswerte und Dendrogramme | 525 | ||
1.6 Wahl der Metriken und Agglomerationsverfahren | 526 | ||
1.7 K-Means (Clusterzentrenanalyse) | 527 | ||
1.8 TwoStep-Clusteranalyse | 529 | ||
2 Mathematisch-statistische Grundlagen | 530 | ||
2.1 Hierarchisch-agglomerative Verfahren | 530 | ||
Ähnlichkeitsmaße und Distanzen | 530 | ||
Gewichtung und Standardisierung von Variablen | 532 | ||
Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten | 532 | ||
Dendrogramm und Ultrametrik | 533 | ||
2.2 K-Means | 534 | ||
2.3 TwoStep-Verfahren | 534 | ||
Die beiden Stufen der Clusterung | 534 | ||
Anzahl der Cluster | 535 | ||
Tabellen und Graphiken zur Beschreibung der Cluster | 536 | ||
3 Beispiel | 536 | ||
3.1 Daten- und Variablenauswahl | 536 | ||
3.2 Analyse | 537 | ||
3.3 Verbesserung der Clusterlösung | 540 | ||
Variablenauswahl | 540 | ||
Eliminieren von „Ausreißern“ | 540 | ||
Optimierung der Lösung durch eine K-Means-Analyse | 541 | ||
3.4 Überprüfen der Clusterlösung | 542 | ||
3.5 TwoStep-Clusteranalyse | 543 | ||
4 Häufige Fehler | 545 | ||
5 Literaturempfehlungen | 546 | ||
Literaturverzeichnis | 547 | ||
22 Analyse latenter Klassen | 548 | ||
1 Einführung in das Verfahren | 548 | ||
2 Mathematisch-statistische Grundlagen | 550 | ||
2.1 Modellansatz | 550 | ||
2.2 Parameterschätzung | 551 | ||
2.3 Computerprogramme | 553 | ||
3 Ein Beispiel | 555 | ||
3.1 Daten | 555 | ||
3.2 Zahl der latenten Klassen | 555 | ||
3.3 Lokale Unabhängigkeit | 559 | ||
3.4 Inhaltliche Interpretierbarkeit | 560 | ||
3.5 Stabilität | 562 | ||
3.6 Formale Validitätsprüfung durch Validitätsindizes | 564 | ||
3.7 Kriterienbezogene Validitätsprüfung | 564 | ||
4 Häufige Fehler | 566 | ||
5 Alternativen | 567 | ||
6 Literaturempfehlungen | 568 | ||
Literaturverzeichnis | 569 | ||
23 Netzwerkanalyse | 570 | ||
1 Einführung | 570 | ||
2 Darstellung der Verfahren | 575 | ||
2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden | 576 | ||
Dyaden | 577 | ||
Triaden | 578 | ||
Triadische Umgebungen einzelner Knoten | 579 | ||
2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung | 582 | ||
2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten | 586 | ||
Cliquen und Clans | 587 | ||
k-Plexe und k-Cores | 588 | ||
Zusammenhangs-Komponenten | 588 | ||
Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen | 589 | ||
3 Ein Beispiel | 589 | ||
3.1 Daten | 589 | ||
3.2 Zielsetzungen | 591 | ||
3.3 Erstellung des Datensatzes | 592 | ||
4 Literaturempfehlungen | 596 | ||
Literaturverzeichnis | 597 | ||
Teil V Regressionsverfahren für Querschnittsdaten | 599 | ||
24 Lineare Regressionsanalyse | 600 | ||
1 Einführung | 600 | ||
2 Mathematisch-statistische Grundlagen | 605 | ||
2.1 Das allgemeine Modell | 605 | ||
2.2 Die Identifikation der Regressionskoeffizienten | 606 | ||
2.3 Annahmen der Kleinst-Quadrat-Methode | 608 | ||
2.4 Die Bestimmung der Modellgüte | 610 | ||
2.5 Die statistische Absicherung der Regressionsergebnisse | 612 | ||
2.6 Die Interpretation der Regressionskoeffizienten | 616 | ||
2.7 Standardisierte Regressionskoeffizienten und ihre Probleme | 618 | ||
3 Ein Beispiel | 621 | ||
3.1 Zur Operationalisierung | 621 | ||
3.2 Ergebnisse | 622 | ||
4 Häufige Fehler | 628 | ||
5 Literaturhinweise | 630 | ||
Literaturverzeichnis | 630 | ||
25 Lineare Regression: Modellannahmen und Regressionsdiagnostik | 632 | ||
1 Einführung | 632 | ||
1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen | 633 | ||
1.2 Regressionsdiagnostik: ein erster Einblick | 635 | ||
2 Mathematisch-statistische Grundlagen | 638 | ||
2.1 Annahmen der linearen Regressionsanalyse | 638 | ||
2.2 Grundlagen und Instrumente der Regressionsdiagnostik | 645 | ||
Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik | 645 | ||
Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells | 646 | ||
Diagnostik zu potenziell einflussreichen Untersuchungseinheiten | 652 | ||
3 Regressionsdiagnostik am Beispiel | 655 | ||
3.1 Datengrundlage und Regressionsmodell | 655 | ||
3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel | 656 | ||
3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel | 661 | ||
4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen | 665 | ||
5 Literaturempfehlungen | 666 | ||
Anhang | 667 | ||
Literaturverzeichnis | 667 | ||
26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines | 669 | ||
1 Einführung | 669 | ||
2 Interaktionseffekte, Polynome und Splines | 670 | ||
2.1 Nicht-Additivität: Interaktionseffekte | 670 | ||
2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation | 673 | ||
2.3 Nicht-Linearität: Polynome und Splines | 674 | ||
2.4 Polynome | 675 | ||
2.5 Splines | 677 | ||
3 Tests auf Gruppenunterschiede und Nicht-Linearität | 681 | ||
4 Anwendungsbeispiel I: Interaktionseffekte | 683 | ||
5 Anwendungsbeispiel II: Polynome und Slopes | 689 | ||
6 Häufige Fehler | 696 | ||
7 Literaturempfehlungen | 697 | ||
Literaturverzeichnis | 697 | ||
27 Robuste Regression | 699 | ||
1 Einführung in das Verfahren | 699 | ||
2 Mathematisch-statistische Grundlagen | 709 | ||
2.1 Der Kleinste-Quadrate-Schätzer | 709 | ||
2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer | 710 | ||
Erwartungstreue, Konsistenz und Effizienz | 710 | ||
Relative Effizienz | 711 | ||
Einfluss-Funktion, Bruchpunkt und maximale Verzerrung | 712 | ||
Zusammenfassung | 713 | ||
2.3 M-Schätzer | 713 | ||
Berechnung von M-Schätzern | 717 | ||
Bruchpunkt von M-Schätzern | 719 | ||
Bounded-Influence-Schätzer | 719 | ||
2.4 High-Breakdown-Schätzer | 720 | ||
LMS- und LTS-Schätzer | 720 | ||
S-Schätzer | 721 | ||
MM-Schätzer | 722 | ||
3 Ein Beispiel | 723 | ||
4 Literaturempfehlungen | 729 | ||
Literaturverzeichnis | 730 | ||
28 Mehrebenenanalyse mit Querschnittsdaten | 733 | ||
1 Einführung in das Verfahren | 733 | ||
2 Mathematisch-statistische Grundlagen | 741 | ||
2.1 Die Modellklassen der Mehrebenenanalyse | 743 | ||
Das Random-Intercept-Only-Modell (R-I-O-M) | 743 | ||
Das Random-Intercept-Modell (R-I-M) | 744 | ||
Random-Intercept-Random-Slope-Modell (R-I-R-S-M) | 744 | ||
Das Intercept-as-Outcome-Modell (I-as-O-M) | 745 | ||
Das Random-Coefficient-Modell (R-C-M) | 746 | ||
2.2 Beurteilung der Anpassung des Mehrebenenmodells | 747 | ||
2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation | 749 | ||
Grand-Mean-Zentrierung | 749 | ||
Group-Mean-Zentrierung | 750 | ||
2.4 Standardisierung der kontextspezifischen und Populationsschätzer | 752 | ||
2.5 Besonderheiten des Erhebungsdesigns | 754 | ||
3 Ein Beispiel – Die deutsche PISA 2006 Studie | 755 | ||
4 Häufige Fehler | 763 | ||
5 Literaturempfehlungen | 764 | ||
Literaturverzeichnis | 765 | ||
29 Strukturgleichungsmodelle | 767 | ||
1 Einführung in das Verfahren | 767 | ||
1.1 Ausgangspunkt: Regressions- und Pfadmodell | 768 | ||
1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen | 769 | ||
1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle | 771 | ||
1.4 Das allgemeine Strukturgleichungsmodell | 773 | ||
Modellevaluation | 775 | ||
Modellvergleich | 776 | ||
Modellsparsamkeit | 777 | ||
1.5 Spezielle Modellvarianten | 778 | ||
Modelle für mehrere Gruppen (Multiple Gruppenvergleiche) | 778 | ||
Längsschnittmodelle | 778 | ||
Modelle mit Interaktionstermen | 778 | ||
Die Behandlung fehlender Werte | 779 | ||
2 Mathematisch-statistische Grundlagen | 779 | ||
2.1 Ableitung der Elemente der Kovarianzmatrix ? | 779 | ||
2.2 Schätzung der Parameter | 780 | ||
3 Ein Beispiel | 783 | ||
3.1 Messung der latenten Konstrukte | 785 | ||
3.2 Messmodell der latenten endogenen Variablen | 785 | ||
3.3 Messmodell der latenten exogenen Variablen | 785 | ||
3.4 Überprüfung der Messmodelle | 786 | ||
3.5 Intervenierende Variablen | 788 | ||
3.6 Strukturgleichungsmodell | 788 | ||
4 Häufige Fehler | 790 | ||
5 Literaturempfehlungen | 792 | ||
Anhang | 793 | ||
Literaturverzeichnis | 794 | ||
30 Regression mit unbekannten Subpopulationen | 797 | ||
1 Einführung in das Verfahren | 797 | ||
2 Mathematisch-statistische Grundlagen | 799 | ||
2.1 Spezifikation | 800 | ||
2.2 Schätzung | 805 | ||
2.3 Test auf die Anzahl der Komponenten | 807 | ||
2.4 Anpassungsindizes | 808 | ||
3 Ein Beispiel | 808 | ||
4 Häufige Fehler | 816 | ||
5 Literaturempfehlungen | 816 | ||
Literaturverzeichnis | 817 | ||
31 Logistische Regression | 818 | ||
1 Einführung in das Verfahren | 818 | ||
1.1 Das lineare Wahrscheinlichkeitsmodell | 819 | ||
1.2 Die logistische Regression | 820 | ||
1.3 Interpretation der Koeffizienten | 822 | ||
2 Mathematisch-statistische Grundlagen | 825 | ||
2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable | 825 | ||
Logit-Regression | 825 | ||
Probit-Regression | 827 | ||
2.2 Schätzung | 827 | ||
2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität | 828 | ||
Standardisierte Koeffizienten | 829 | ||
Durchschnittliche marginale Effekte | 830 | ||
2.4 Interaktionseffekte | 831 | ||
2.5 Statistische Inferenz | 833 | ||
2.6 Goodness of fit und Modellvergleich | 834 | ||
3 Ein Beispiel | 835 | ||
4 Häufige Fehler | 843 | ||
5 Literaturempfehlungen | 844 | ||
Literaturverzeichnis | 845 | ||
32 Multinomiale und ordinale Regression | 846 | ||
1 Einführung in das Verfahren | 846 | ||
1.1 Von der binären zur multinomialen logistischen Regression | 847 | ||
1.2 Wahrscheinlichkeiten, Odds und Logits | 848 | ||
1.3 Modellschätzung und statistische Tests | 852 | ||
Besteht ein Zusammenhang? | 853 | ||
Wie stark ist ein Zusammenhang? | 853 | ||
Wie stark sind die relativen Effekte der erklärenden Variablen? | 854 | ||
1.4 Logistische Regression bei einer ordinalen abhängigen Variablen | 855 | ||
1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression | 857 | ||
2 Mathematisch-Statistische Grundlagen | 859 | ||
2.1 Schätzung | 859 | ||
2.2 Statistische Inferenz | 860 | ||
2.3 Modellanpassung | 861 | ||
2.4 Weiterführendes zu Regressionskoeffizienten | 862 | ||
Standardisierte Koeffizienten im ordinalen Regressionsmodell | 862 | ||
Umrechnen der Referenzkategorie im multinomialen Regressionsmodell | 862 | ||
3 Anwendungsbeispiel | 863 | ||
3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression | 863 | ||
3.2 Bildungsabschluss im ordinalen Logitmodell | 870 | ||
4 Häufige Fehler | 873 | ||
5 Literaturempfehlungen | 877 | ||
Literaturverzeichnis | 877 | ||
33 Regression für Zählvariablen | 878 | ||
1 Einführung in das Verfahren | 878 | ||
1.1 Poisson und negative Binomialverteilung | 879 | ||
1.2 Regressionsmodellierung | 880 | ||
Strukturkomponente | 880 | ||
Strukturkomponente: lineare und nichtlineare Prädiktoren | 881 | ||
Verteilungskomponente | 883 | ||
Inferenz | 883 | ||
2 Mathematisch-statistische Grundlagen | 884 | ||
2.1 Poissonmodell | 884 | ||
Maximum-Likelihood-Schätzung | 884 | ||
Parameter-Tests | 885 | ||
Devianz und Anpassungstests | 887 | ||
2.2 Quasi-Poissonmodell | 888 | ||
2.3 Modell der negativen Binomialverteilung | 889 | ||
3 Ein Beispiel | 889 | ||
4 Häufige Fehler | 893 | ||
5 Literaturempfehlungen | 894 | ||
Literaturverzeichnis | 894 | ||
34 Graphische Darstellung regressionsanalytischer Ergebnisse | 896 | ||
1 Einführung in das Verfahren | 896 | ||
2 Grundlagen der graphischen Darstellung | 897 | ||
3 Beispiele | 900 | ||
3.1 Streudiagramm- bzw. Scatterplot-Matrix | 900 | ||
3.2 Median- und Mean-Regression | 902 | ||
3.3 Lineare Regression: Graphische Darstellung der Koeffizienten | 903 | ||
3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots) | 905 | ||
3.5 Logistische Regression: Conditional-Effect-Plots | 908 | ||
3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots | 911 | ||
4 Häufige Fehler | 915 | ||
5 Rückblick | 916 | ||
6 Literaturempfehlungen | 917 | ||
Literaturverzeichnis | 918 | ||
Teil VI Analyse von zeitbezogenen Daten | 919 | ||
35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren | 920 | ||
1 Einführung in das Verfahren | 920 | ||
1.1 Grundannahmen kausaler Inferenz in Matchingverfahren | 921 | ||
1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse | 924 | ||
1.3 Durchführung der empirischen Analyse | 925 | ||
1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen | 930 | ||
2 Mathematisch-statistische Grundlagen | 931 | ||
3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes | 937 | ||
3.1 Zuweisungsmodell | 938 | ||
3.2 Matching und Balancierungstests | 940 | ||
3.3 Parameterschätzung | 944 | ||
4 Häufige Fehler | 947 | ||
5 Literaturempfehlungen | 949 | ||
Literaturverzeichnis | 949 | ||
36 Kausalanalyse mit Paneldaten | 951 | ||
1 Einführung in die Paneldatenanalyse | 951 | ||
1.1 Kontrafaktische Kausalanalyse und Paneldaten | 952 | ||
1.2 Eine intuitive Einführung in Panelregressionsmodelle | 954 | ||
1.3 Ein didaktisches Beispiel | 956 | ||
2 Eine präzisere Einführung in die Panelregression | 959 | ||
2.1 Das Fehlerkomponenten-Modell | 960 | ||
2.2 Die Schätzverfahren | 960 | ||
2.3 RE- oder FE-Modell? | 963 | ||
2.4 Ein Hybrid-Modell | 964 | ||
2.5 Panel-robuste Standardfehler | 965 | ||
3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit | 966 | ||
3.1 Datenaufbereitung | 966 | ||
3.2 Schätzergebnisse | 968 | ||
3.3 Ein Modell mit Periodeneffekten | 970 | ||
3.4 Ein Hybrid-Modell | 971 | ||
3.5 Ein Wachstumskurven-Modell | 972 | ||
4 Nicht-lineare FE-Modelle | 973 | ||
4.1 Nicht-lineare Panelregressionsmodelle | 974 | ||
4.2 Das FE-Logit Modell | 974 | ||
4.3 FE-Modelle für Ereignisdaten | 976 | ||
5 Häufige Fehler | 978 | ||
5.1 Suboptimale Panelregressionsmodelle | 978 | ||
5.2 Grenzen von FE-Modellen | 979 | ||
6 Literaturempfehlungen | 981 | ||
Literaturverzeichnis | 981 | ||
37 Survival- und Ereignisanalyse | 983 | ||
1 Einführung in das Verfahren | 983 | ||
1.1 Spezifische Problemstellungen | 984 | ||
1.2 Erhebung von Ereignisdaten | 986 | ||
1.3 Zensierung von Beobachtungen | 987 | ||
2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation | 988 | ||
2.1 Verschiedene Ratenmodelle und ihre Schätzung | 991 | ||
Sterbetafelmethode und Kaplan-Meier-Schätzung | 991 | ||
Das Exponentialmodell | 992 | ||
Das Cox-Modell | 992 | ||
Das Piecewise-Constant-Modell | 993 | ||
Parametrische Modelle der Zeitabhängigkeit | 994 | ||
2.2 Ein Beispiel | 994 | ||
3 Modellierung von parallelen und interdependenten Prozessen | 996 | ||
3.1 Ursachen und zeitabhängige Kovariablen | 997 | ||
3.2 Zeit und kausale Wirkungen | 998 | ||
3.3 Zeitachse und Ereignisse | 998 | ||
3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit | 998 | ||
3.5 Zeitliche Form der Entfaltung von Wirkungen | 999 | ||
3.6 Das Prinzip der konditionalen Unabhängigkeit | 999 | ||
3.7 Ein Anwendungsbeispiel | 1000 | ||
4 Häufige Fehler | 1001 | ||
5 Literaturempfehlungen | 1002 | ||
Literaturverzeichnis | 1003 | ||
38 Latente Wachstumskurvenmodelle | 1005 | ||
1 Einführung in das Verfahren | 1005 | ||
2 Mathematisch-statistische Grundlagen | 1009 | ||
3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust | 1012 | ||
4 Häufige Fehler | 1014 | ||
5 Literaturempfehlungen | 1016 | ||
Literaturverzeichnis | 1016 | ||
39 Sequenzdatenanalyse | 1018 | ||
1 Einführung in die Sequenzdatenanalyse | 1018 | ||
1.1 Was ist Sequenzdatenanalyse? | 1019 | ||
1.2 Grundlegende Konzepte | 1020 | ||
2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung | 1024 | ||
2.1 Der Optimal Matching Algorithmus | 1024 | ||
2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen | 1026 | ||
2.3 Die Diskussion um OM und neuere Entwicklungen | 1026 | ||
3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen | 1028 | ||
3.1 Datenaufbereitung | 1028 | ||
3.2 Datenauswertung | 1030 | ||
4 Häufige Fehler | 1035 | ||
5 Literaturempfehlungen | 1037 | ||
Literaturverzeichnis | 1037 | ||
40 Zeitreihenanalyse | 1039 | ||
1 Einführung | 1039 | ||
2 Deskription und statistisches Modell | 1041 | ||
3 Stochastische Prozesse | 1042 | ||
4 Nichtstationäre (stochastische) Prozesse | 1047 | ||
5 Tests auf „Random Walk“ | 1049 | ||
6 Zerlegung von Zeitreihen | 1053 | ||
7 Interventionsanalyse | 1059 | ||
8 Ausreißer-Analyse | 1061 | ||
9 Transferfunktions-Modelle | 1064 | ||
10 Vektorielle stochastische Prozesse | 1068 | ||
11 Schluss | 1073 | ||
12 Literaturempfehlungen | 1074 | ||
Literaturverzeichnis | 1074 | ||
Anhang | 1077 | ||
Autorenverzeichnis | 1078 |