Handbuch der sozialwissenschaftlichen Datenanalyse

von: Christof Wolf, Henning Best

VS Verlag für Sozialwissenschaften (GWV), 2011

ISBN: 9783531920382

Sprache: Deutsch

1083 Seiten, Download: 7794 KB

Format: PDF, auch als Online-Lesen

geeignet für:

eBook anfordern

▸

Mehr zum Inhalt

Handbuch der sozialwissenschaftlichen Datenanalyse

	Vorwort	5
	Inhaltsverzeichnis	6
	Teil I Einführung	10
	1 Einführung: Sozialwissenschaftliche Datenanalyse	11
	1 Moderne Sozialwissenschaft und die Bedeutung der Statistik	11
	2 Ziele und Zielgruppe des Handbuchs	12
	3 Themenauswahl	13
	4 Gliederung und Inhal	14
	5 Ausblick	14
	Literaturverzeichnis	15
	2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik	16
	1 Einführung	16
	2 Was heißt Kausalität?	17
	2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität	18
	2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen	18
	2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität	18
	2.4 Kausalität als „Mechanismus“	19
	2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn?	19
	2.6 Exkurs: Die Logik der Erklärung	20
	2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität	21
	2.8 Zum Vergleich der Kausalitäts-Definitionen	23
	3 Kausalität in sozialwissenschaftlichen Experimenten	24
	4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression	27
	4.1 Enthalten Kausalmodelle Kausalaussagen?	27
	4.2 Regressionsanalyse und kausale Schlüsse	28
	4.3 Kausalität in anderen multivariaten Verfahren	33
	4.4 Gibt es Algorithmen für die Ermittlung von Kausalität?	34
	5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen	36
	6 Kausalität in Messmodellen	38
	7 Resümee	41
	8 Literaturempfehlungen	41
	Literaturverzeichnis	42
	Teil II Grundlagen der Datenanalyse	46
	3 Datengewinnung und Datenaufbereitung	47
	1 Daten	47
	2 Formen der Datenerhebung	49
	2.1 Befragung	49
	Persönlich-Mündliches Interview	53
	Schriftliche Befragung	54
	Telefonbefragung	56
	Onlinebefragungen	57
	Entscheidung für eine Befragungsform	60
	2.2 Beobachtung	61
	3 Stichprobenziehung	63
	4 Datenaufbereitung	66
	4.1 Transkription	66
	4.2 Kodierung	66
	4.3 Plausibilisierung	67
	4.4 Gewichtung	68
	4.5 Archivierung	68
	5 Literaturempfehlungen	69
	Literaturverzeichnis	69
	4 Uni- und bivariate deskriptive Statistik	71
	1 Univariate Statistik	71
	1.1 Lagemaße	71
	Arithmetische Mittel	71
	Median (Zentralwert)	72
	Modalwert	74
	1.2 Streuungsmaße	74
	Varianz, Standardabweichung und Variationskoeffizient	75
	Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung	77
	Index qualitativer Variation	78
	1.3 Schiefe	78
	2 Bivariate Statistik	79
	2.1 Tabellenanalyse	81
	Spalten-, Zeilen- und Gesamtprozente	81
	Prozentuierung und statistische Unabhängigkeit	82
	Prozentsatzdifferenz	83
	Odds und Odds-Ratio	84
	Nominalskalierte Maße: Cramérs V	85
	Ordinalskalierte Merkmale	87
	2.2 Metrische Merkmale: Kovarianz und Korrelation	91
	3 Ausblick	94
	4 Literaturempfehlungen	94
	Literaturverzeichnis	94
	5 Graphische Datenexploration	96
	1 Einführung	96
	2 Graphische Methoden für die Datenexploration	98
	2.1 Einteilungskriterien für graphische Darstellungen	98
	2.2 Univariate Analysen	99
	Untersuchung der empirischen Häufigkeitsverteilung	99
	Vergleich von Verteilungen	108
	Die Darstellung von Zeitreihen	112
	2.3 Bivariate Analysen	113
	Das Anscombe-Quartett	114
	Streudiagramm	115
	2.4 Multivariate Analysen	117
	3 Fehlervermeidung und Hinweise zum praktischen Vorgehen	119
	4 Literaturempfehlungen	120
	Anhang	120
	Literaturverzeichnis	121
	6 Der Umgang mit fehlenden Werten	122
	1 Einführung in Techniken zur Kompensation fehlender Werte	122
	1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit	122
	1.2 Gewichtung	125
	Schätzung der Responsewahrscheinlichkeiten	126
	Gewichten oder nicht?	127
	Ergänzungen	128
	1.3 Multiple Imputation	129
	Voraussetzungen	129
	Erzeugung multipler Imputationen	130
	Auswertung multipel imputierter Datensätze	132
	Ergänzungen	133
	2 Mathematisch-statistische Grundlagen	134
	2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit	134
	2.2 Gewichtung	135
	2.3 Multiple Imputation	137
	3 Beispiel: Einkommensgleichung mit fehlenden Werten	140
	4 Häufige Fehler	144
	5 Literaturempfehlungen	146
	Literaturverzeichnis	147
	7 Gewichtung	148
	1 Einführung in das Verfahren	148
	2 Mathematisch-statistische Grundlagen	150
	2.1 Designgewichtung in komplexen Stichprobenerhebungen	152
	Schichtung	153
	Proportionale Aufteilung	154
	Disproportionale Schichtung	154
	Klumpenauswahl	155
	Auswahl mit ungleichen Wahrscheinlichkeiten	156
	2.2 Kombination von Anpassungs- und Designgewichtung	158
	3 Gewichtung am Beispiel des ESS	163
	4 Häufige Fehler	168
	5 Literaturempfehlungen	168
	Literaturverzeichnis	168
	8 Grundlagen des statistischen Schließens	170
	1 Einführung in die Fragestellung	170
	2 Statistisches Schätzen	171
	2.1 Eigenschaften von Schätzern	172
	2.2 Intervallschätzung	175
	3 Statistisches Testen	179
	3.1 Hypothesentests über Konfidenzintervalle	179
	3.2 Signifikanztests	180
	3.3 Berücksichtigung der Trennschärfe von Tests	183
	3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests	185
	4 Anwendungsfehler und Anwendungsprobleme	187
	4.1 Fallzahlabhängigkeit	188
	4.2 Spezifikation der statistischen Fragestellung	189
	4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse	190
	Interpretation von Konfidenzintervallen	190
	Interpretation von Signifikanzen	190
	Formulierung der Forschungshypothese als Alternativhypothese	191
	Multiples Testen	191
	Modell-Fitting	192
	Stichprobenpläne als Quelle von Interpretationsfehlern	193
	5 Literaturhinweise	193
	Literaturverzeichnis	194
	9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap	195
	1 Einführung in das Verfahren	195
	2 Mathematisch-statistische Grundlagen	199
	2.1 Standardfehler und Konfidenzintervall von ˆ?	199
	Normale Approximationsmethode	200
	Perzentil-Methode	200
	Bias-corrected and accelerated Methode (BCa)	200
	2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten	202
	3 Ein Beispiel	203
	3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation	205
	4 Häufige Fehler	206
	5 Literaturempfehlungen	208
	Literaturverzeichnis	208
	10 Maximum-Likelihood Schätztheorie	209
	1 Einführung in das Verfahren	210
	2 Die Mechanik des Maximum-Likelihood Verfahrens	212
	2.1 Das ML-Verfahren zur Bestimmung eines Parameters	213
	2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter	218
	3 Statistische Eigenschaften der ML-Schätzer	223
	4 Inferenzstatistik und Modellanpassung	226
	4.1 Test auf Signifikanz individueller Parameter	227
	4.2 Test auf Signifikanz mehrerer Parameter	228
	Likelihood Ratio Test	228
	Wald-Test	229
	Lagrange Multiplikatortest	230
	4.3 Modellgüte	231
	McFadden R2	232
	Wald- und LM-basierte R2	233
	AIC und BIC	234
	5 Numerische Optimierungsverfahren	235
	6 Literaturempfehlungen	237
	Literaturverzeichnis	238
	Teil III Messen und Skalieren	240
	11 Reliabilität, Validität, Objektivität	241
	1 Einführung	241
	2 Objektivität	242
	2.1 Durchführungsobjektivität	242
	2.2 Auswertungsobjektivität	243
	2.3 Interpretationsobjektivität	244
	3 Reliabilität	244
	3.1 Retest-Reliabilität	246
	Beispiel zur Bestimmung der Retest-Reliabilität	247
	3.2 Die Paralleltest-Reliabilität	247
	3.3 Die Split-Half-Reliabilität	248
	Beispiel zur Bestimmung der Split-Half-Reliabilität	249
	3.4 Konsistenzanalysen	250
	Beispiel zur Bestimmung der internen Konsistenz	250
	3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten	251
	4 Validität	252
	4.1 Die Inhaltsvalidität	252
	4.2 Kriteriumsvalidität	253
	4.3 Konstruktvalidität	255
	Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität)	255
	Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten	256
	Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil	257
	5 Vorgehen zur Güteüberprüfung von Skalen	258
	6 Häufige Fehler	259
	7 Literaturempfehlungen	259
	Literaturverzeichnis	260
	12 Thurstone- und Likertskalierung	261
	1 Einleitung	261
	2 Thurstone Skalierung	262
	2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ)	262
	Grundlagen des Verfahrens	262
	Vorgehensweise bei der Skalierung	264
	Anwendungsbeispiel	266
	2.2 Die Methode der gleich erscheinenden Intervalle	270
	2.3 Die Methode der sukzessiven Intervalle (MSI)	272
	Grundlagen des Verfahrens	272
	Anwendungsbeispiel	273
	2.4 Häufige Fehler bei der Thurstone Skalierung	277
	3 Likertskalierung	277
	3.1 Grundlagen des Verfahrens	277
	3.2 Anwendungsbeispiel	279
	3.3 Häufige Fehler bei der Likert Skalierung	282
	4 Literaturempfehlungen	282
	Literaturverzeichnis	282
	13 Guttman- und Mokkenskalierung	284
	1 Einleitung	284
	2 Guttmanskalierung	286
	2.1 Grundlagen des Verfahrens	286
	Modellannahmen	288
	Schätzung von Item- und Personenparametern	289
	Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern	290
	Modellprüfung	291
	2.2 Anwendungsbeispiel	297
	2.3 Häufige Fehler bei der Guttmanskalierung	299
	3 Mokkenskalierung	300
	3.1 Grundlagen des Verfahrens	300
	Modellprüfung	302
	3.2 Anwendungsbeispiel	306
	3.3 Häufige Fehler bei der Mokkenskalierung	308
	4 Literaturempfehlungen	308
	Literaturverzeichnis	309
	14 Item-Response-Theorie	311
	1 Einführung	312
	2 Modelle für dichotome Items	313
	2.1 Das Rasch-Modell	313
	2.2 Das Birnbaum-Modell	316
	2.3 Das Modell mit Rateparameter	317
	3 Modelle für mehrstufig geordnete Items	318
	3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell)	318
	3.2 Weitere IRT-Modelle für ordinale Items	320
	4 Weitere IRT-Modelle	321
	4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell	321
	5 Modelltestung und Modellvergleiche	322
	6 Beispielanwendung	324
	6.1 Anwendung 1: Kompetenzmessung	324
	6.2 Anwendung 2: Surveyforschung	326
	7 Häufige Fehler	330
	8 Literaturempfehlungen	331
	Literaturverzeichnis	331
	15 Hauptkomponentenanalyse und explorative Faktorenanalyse	333
	1 Einführung in das Verfahren	333
	1.1 Einsatzmöglichkeiten	333
	1.2 Die Hauptkomponentenanalyse	336
	Eine geometrische Perspektive	336
	Die konkreten Schritte der PCA	340
	Bestimmung der Komponentenzahl	341
	Die unrotierte Lösung	343
	Rotation	344
	Berechnung von Komponentenwerten	347
	1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne	348
	2 Mathematisch-statistische Grundlagen	350
	3 Ein Anwendungsbeispiel: Vertrauen in Institutionen	354
	4 Probleme und Erweiterungen	360
	5 Literaturempfehlungen	363
	Anhang	364
	Literaturverzeichnis	364
	16 Korrespondenzanalyse	366
	1 Einleitung	366
	2 Mathematisch-statistische Grundlagen	368
	3 Ein Beispiel	370
	3.1 Graphische Darstellung	370
	3.2 Numerische Darstellung	373
	4 Erweiterungen der Korrespondenzanalyse	376
	4.1 Zusammengesetzte Tabellen	376
	4.2 Multiple Korrespondenzanalyse	378
	4.3 Aktive und passive Merkmale	382
	4.4 Andere Datenformate	384
	5 Häufige Fehler	385
	6 Diskussion	386
	7 Literaturempfehlungen	386
	Literaturverzeichnis	387
	17 Multidimensionale Skalierung	389
	1 Einführung in die MDS	389
	1.1 Die MDS als psychologisches Modell	390
	1.2 Die MDS zur Exploration von Datenstrukturen	392
	2 Mathematische Grundlagen der MDS	393
	2.1 Güte einer MDS-Lösung	393
	2.2 Bewertung des Stress	395
	2.3 MDS-Modelle	397
	2.4 MDS-Algorithmen	400
	2.5 Konfirmatorische MDS	400
	3 Häufige Fehler	403
	3.1 Degenerierte Lösungen in der ordinalen MDS	403
	3.2 Falsche Polung der Proximitäten	405
	3.3 Fehlbewertung von Stress	406
	3.4 Fehler beim Vergleich verschiedener MDS-Lösungen	407
	3.5 Mechanische Interpretation „der“ Dimensionen	409
	3.6 Behandlung störender Punkte	412
	3.7 Überinterpretation von Dimensionsgewichten	413
	4 Literaturempfehlungen	413
	Anhang	414
	Literaturverzeichnis	415
	Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen	417
	18 Analyse kategorialer Daten	418
	1 Einführung in das Verfahren	418
	2 Mathematisch-statistische Grundlagen	430
	3 Ein Beispiel	440
	4 Häufige Fehler	448
	5 Literaturempfehlungen	450
	Literaturverzeichnis	450
	19 Varianz- und Kovarianzanalyse	452
	1 Einführung in das Verfahren	452
	1.1 Vergleich von zwei Gruppen	454
	Modellgleichung	455
	Hypothesen	455
	Quadratsummen	456
	Freiheitsgrade	457
	Allgemeine Teststatistik	457
	Annahmen	459
	Exkurs: Mittlere Quadratsummen	460
	1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse	461
	1.3 Mehrfaktorielle Varianzanalyse	462
	Modellgleichung	462
	Hypothesen	463
	Quadratsummen	463
	Freiheitsgrade	464
	Teststatistik	465
	Annahmen	465
	1.4 Kovarianzanalyse	466
	Modellgleichung	467
	ANOVA versus ANCOVA	467
	1.5 Effektstärke	468
	1.6 Teststärke	471
	2 Mathematisch-statistische Grundlagen	472
	2.1 ANOVA und ANCOVA als Spezialfälle des ALM	473
	2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM	477
	3 Ein Beispiel	480
	3.1 Vergleich von zwei Gruppen	480
	3.2 Vergleich von mehr als zwei Gruppen	481
	3.3 Mehrfaktorielle ANOVA	482
	3.4 Kovarianzanalyse	484
	3.5 Annahmen der Varianz- und Kovarianzanalyse	484
	3.6 Teststärke	488
	4 Häufige Fehler – eine Checkliste	488
	5 Literaturempfehlungen	489
	Literaturverzeichnis	489
	20 Diskriminanzanalyse	491
	1 Einführung in das Verfahren	491
	1.1 Zielsetzung und Anwendungsmöglichkeiten	491
	1.2 Problemstellung und Prämissen	493
	1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren	495
	1.4 Vorgehensweise	497
	Festlegung des Untersuchungsdesigns	497
	Extraktion der Diskriminanzfunktion(en)	498
	Evaluation der Diskriminanzfunktion(en)	500
	Merkmalsselektion und Klassifikation neuer Objekte	502
	2 Mathematisch-statistische Grundlagen	503
	2.1 Ermittlung der Diskriminanzfunktion (en)	503
	2.2 Prüfkriterien der Diskriminanz	507
	2.3 Klassifikationskonzepte	508
	Distanzkonzept	509
	Wahrscheinlichkeitskonzept	510
	Konzept der Klassifikationsfunktionen nach Fisher	510
	3 Anwendungsbeispiel	511
	4 Häufige Fehler	515
	5 Literaturempfehlungen	517
	Literaturverzeichnis	518
	21 Clusteranalyse	520
	1 Einführung in das Verfahren	520
	1.1 Was ist Clusteranalyse und was sind überhaupt Cluster?	521
	1.2 Clusterstruktur	522
	1.3 Algorithmen	522
	1.4 Variablenräume	523
	1.5 Agglomerative Verfahren	524
	Ähnlichkeitsmaß, Distanz und Index	524
	Fusionswerte und Dendrogramme	525
	1.6 Wahl der Metriken und Agglomerationsverfahren	526
	1.7 K-Means (Clusterzentrenanalyse)	527
	1.8 TwoStep-Clusteranalyse	529
	2 Mathematisch-statistische Grundlagen	530
	2.1 Hierarchisch-agglomerative Verfahren	530
	Ähnlichkeitsmaße und Distanzen	530
	Gewichtung und Standardisierung von Variablen	532
	Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten	532
	Dendrogramm und Ultrametrik	533
	2.2 K-Means	534
	2.3 TwoStep-Verfahren	534
	Die beiden Stufen der Clusterung	534
	Anzahl der Cluster	535
	Tabellen und Graphiken zur Beschreibung der Cluster	536
	3 Beispiel	536
	3.1 Daten- und Variablenauswahl	536
	3.2 Analyse	537
	3.3 Verbesserung der Clusterlösung	540
	Variablenauswahl	540
	Eliminieren von „Ausreißern“	540
	Optimierung der Lösung durch eine K-Means-Analyse	541
	3.4 Überprüfen der Clusterlösung	542
	3.5 TwoStep-Clusteranalyse	543
	4 Häufige Fehler	545
	5 Literaturempfehlungen	546
	Literaturverzeichnis	547
	22 Analyse latenter Klassen	548
	1 Einführung in das Verfahren	548
	2 Mathematisch-statistische Grundlagen	550
	2.1 Modellansatz	550
	2.2 Parameterschätzung	551
	2.3 Computerprogramme	553
	3 Ein Beispiel	555
	3.1 Daten	555
	3.2 Zahl der latenten Klassen	555
	3.3 Lokale Unabhängigkeit	559
	3.4 Inhaltliche Interpretierbarkeit	560
	3.5 Stabilität	562
	3.6 Formale Validitätsprüfung durch Validitätsindizes	564
	3.7 Kriterienbezogene Validitätsprüfung	564
	4 Häufige Fehler	566
	5 Alternativen	567
	6 Literaturempfehlungen	568
	Literaturverzeichnis	569
	23 Netzwerkanalyse	570
	1 Einführung	570
	2 Darstellung der Verfahren	575
	2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden	576
	Dyaden	577
	Triaden	578
	Triadische Umgebungen einzelner Knoten	579
	2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung	582
	2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten	586
	Cliquen und Clans	587
	k-Plexe und k-Cores	588
	Zusammenhangs-Komponenten	588
	Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen	589
	3 Ein Beispiel	589
	3.1 Daten	589
	3.2 Zielsetzungen	591
	3.3 Erstellung des Datensatzes	592
	4 Literaturempfehlungen	596
	Literaturverzeichnis	597
	Teil V Regressionsverfahren für Querschnittsdaten	599
	24 Lineare Regressionsanalyse	600
	1 Einführung	600
	2 Mathematisch-statistische Grundlagen	605
	2.1 Das allgemeine Modell	605
	2.2 Die Identifikation der Regressionskoeffizienten	606
	2.3 Annahmen der Kleinst-Quadrat-Methode	608
	2.4 Die Bestimmung der Modellgüte	610
	2.5 Die statistische Absicherung der Regressionsergebnisse	612
	2.6 Die Interpretation der Regressionskoeffizienten	616
	2.7 Standardisierte Regressionskoeffizienten und ihre Probleme	618
	3 Ein Beispiel	621
	3.1 Zur Operationalisierung	621
	3.2 Ergebnisse	622
	4 Häufige Fehler	628
	5 Literaturhinweise	630
	Literaturverzeichnis	630
	25 Lineare Regression: Modellannahmen und Regressionsdiagnostik	632
	1 Einführung	632
	1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen	633
	1.2 Regressionsdiagnostik: ein erster Einblick	635
	2 Mathematisch-statistische Grundlagen	638
	2.1 Annahmen der linearen Regressionsanalyse	638
	2.2 Grundlagen und Instrumente der Regressionsdiagnostik	645
	Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik	645
	Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells	646
	Diagnostik zu potenziell einflussreichen Untersuchungseinheiten	652
	3 Regressionsdiagnostik am Beispiel	655
	3.1 Datengrundlage und Regressionsmodell	655
	3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel	656
	3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel	661
	4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen	665
	5 Literaturempfehlungen	666
	Anhang	667
	Literaturverzeichnis	667
	26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines	669
	1 Einführung	669
	2 Interaktionseffekte, Polynome und Splines	670
	2.1 Nicht-Additivität: Interaktionseffekte	670
	2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation	673
	2.3 Nicht-Linearität: Polynome und Splines	674
	2.4 Polynome	675
	2.5 Splines	677
	3 Tests auf Gruppenunterschiede und Nicht-Linearität	681
	4 Anwendungsbeispiel I: Interaktionseffekte	683
	5 Anwendungsbeispiel II: Polynome und Slopes	689
	6 Häufige Fehler	696
	7 Literaturempfehlungen	697
	Literaturverzeichnis	697
	27 Robuste Regression	699
	1 Einführung in das Verfahren	699
	2 Mathematisch-statistische Grundlagen	709
	2.1 Der Kleinste-Quadrate-Schätzer	709
	2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer	710
	Erwartungstreue, Konsistenz und Effizienz	710
	Relative Effizienz	711
	Einfluss-Funktion, Bruchpunkt und maximale Verzerrung	712
	Zusammenfassung	713
	2.3 M-Schätzer	713
	Berechnung von M-Schätzern	717
	Bruchpunkt von M-Schätzern	719
	Bounded-Influence-Schätzer	719
	2.4 High-Breakdown-Schätzer	720
	LMS- und LTS-Schätzer	720
	S-Schätzer	721
	MM-Schätzer	722
	3 Ein Beispiel	723
	4 Literaturempfehlungen	729
	Literaturverzeichnis	730
	28 Mehrebenenanalyse mit Querschnittsdaten	733
	1 Einführung in das Verfahren	733
	2 Mathematisch-statistische Grundlagen	741
	2.1 Die Modellklassen der Mehrebenenanalyse	743
	Das Random-Intercept-Only-Modell (R-I-O-M)	743
	Das Random-Intercept-Modell (R-I-M)	744
	Random-Intercept-Random-Slope-Modell (R-I-R-S-M)	744
	Das Intercept-as-Outcome-Modell (I-as-O-M)	745
	Das Random-Coefficient-Modell (R-C-M)	746
	2.2 Beurteilung der Anpassung des Mehrebenenmodells	747
	2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation	749
	Grand-Mean-Zentrierung	749
	Group-Mean-Zentrierung	750
	2.4 Standardisierung der kontextspezifischen und Populationsschätzer	752
	2.5 Besonderheiten des Erhebungsdesigns	754
	3 Ein Beispiel – Die deutsche PISA 2006 Studie	755
	4 Häufige Fehler	763
	5 Literaturempfehlungen	764
	Literaturverzeichnis	765
	29 Strukturgleichungsmodelle	767
	1 Einführung in das Verfahren	767
	1.1 Ausgangspunkt: Regressions- und Pfadmodell	768
	1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen	769
	1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle	771
	1.4 Das allgemeine Strukturgleichungsmodell	773
	Modellevaluation	775
	Modellvergleich	776
	Modellsparsamkeit	777
	1.5 Spezielle Modellvarianten	778
	Modelle für mehrere Gruppen (Multiple Gruppenvergleiche)	778
	Längsschnittmodelle	778
	Modelle mit Interaktionstermen	778
	Die Behandlung fehlender Werte	779
	2 Mathematisch-statistische Grundlagen	779
	2.1 Ableitung der Elemente der Kovarianzmatrix ?	779
	2.2 Schätzung der Parameter	780
	3 Ein Beispiel	783
	3.1 Messung der latenten Konstrukte	785
	3.2 Messmodell der latenten endogenen Variablen	785
	3.3 Messmodell der latenten exogenen Variablen	785
	3.4 Überprüfung der Messmodelle	786
	3.5 Intervenierende Variablen	788
	3.6 Strukturgleichungsmodell	788
	4 Häufige Fehler	790
	5 Literaturempfehlungen	792
	Anhang	793
	Literaturverzeichnis	794
	30 Regression mit unbekannten Subpopulationen	797
	1 Einführung in das Verfahren	797
	2 Mathematisch-statistische Grundlagen	799
	2.1 Spezifikation	800
	2.2 Schätzung	805
	2.3 Test auf die Anzahl der Komponenten	807
	2.4 Anpassungsindizes	808
	3 Ein Beispiel	808
	4 Häufige Fehler	816
	5 Literaturempfehlungen	816
	Literaturverzeichnis	817
	31 Logistische Regression	818
	1 Einführung in das Verfahren	818
	1.1 Das lineare Wahrscheinlichkeitsmodell	819
	1.2 Die logistische Regression	820
	1.3 Interpretation der Koeffizienten	822
	2 Mathematisch-statistische Grundlagen	825
	2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable	825
	Logit-Regression	825
	Probit-Regression	827
	2.2 Schätzung	827
	2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität	828
	Standardisierte Koeffizienten	829
	Durchschnittliche marginale Effekte	830
	2.4 Interaktionseffekte	831
	2.5 Statistische Inferenz	833
	2.6 Goodness of fit und Modellvergleich	834
	3 Ein Beispiel	835
	4 Häufige Fehler	843
	5 Literaturempfehlungen	844
	Literaturverzeichnis	845
	32 Multinomiale und ordinale Regression	846
	1 Einführung in das Verfahren	846
	1.1 Von der binären zur multinomialen logistischen Regression	847
	1.2 Wahrscheinlichkeiten, Odds und Logits	848
	1.3 Modellschätzung und statistische Tests	852
	Besteht ein Zusammenhang?	853
	Wie stark ist ein Zusammenhang?	853
	Wie stark sind die relativen Effekte der erklärenden Variablen?	854
	1.4 Logistische Regression bei einer ordinalen abhängigen Variablen	855
	1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression	857
	2 Mathematisch-Statistische Grundlagen	859
	2.1 Schätzung	859
	2.2 Statistische Inferenz	860
	2.3 Modellanpassung	861
	2.4 Weiterführendes zu Regressionskoeffizienten	862
	Standardisierte Koeffizienten im ordinalen Regressionsmodell	862
	Umrechnen der Referenzkategorie im multinomialen Regressionsmodell	862
	3 Anwendungsbeispiel	863
	3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression	863
	3.2 Bildungsabschluss im ordinalen Logitmodell	870
	4 Häufige Fehler	873
	5 Literaturempfehlungen	877
	Literaturverzeichnis	877
	33 Regression für Zählvariablen	878
	1 Einführung in das Verfahren	878
	1.1 Poisson und negative Binomialverteilung	879
	1.2 Regressionsmodellierung	880
	Strukturkomponente	880
	Strukturkomponente: lineare und nichtlineare Prädiktoren	881
	Verteilungskomponente	883
	Inferenz	883
	2 Mathematisch-statistische Grundlagen	884
	2.1 Poissonmodell	884
	Maximum-Likelihood-Schätzung	884
	Parameter-Tests	885
	Devianz und Anpassungstests	887
	2.2 Quasi-Poissonmodell	888
	2.3 Modell der negativen Binomialverteilung	889
	3 Ein Beispiel	889
	4 Häufige Fehler	893
	5 Literaturempfehlungen	894
	Literaturverzeichnis	894
	34 Graphische Darstellung regressionsanalytischer Ergebnisse	896
	1 Einführung in das Verfahren	896
	2 Grundlagen der graphischen Darstellung	897
	3 Beispiele	900
	3.1 Streudiagramm- bzw. Scatterplot-Matrix	900
	3.2 Median- und Mean-Regression	902
	3.3 Lineare Regression: Graphische Darstellung der Koeffizienten	903
	3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots)	905
	3.5 Logistische Regression: Conditional-Effect-Plots	908
	3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots	911
	4 Häufige Fehler	915
	5 Rückblick	916
	6 Literaturempfehlungen	917
	Literaturverzeichnis	918
	Teil VI Analyse von zeitbezogenen Daten	919
	35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren	920
	1 Einführung in das Verfahren	920
	1.1 Grundannahmen kausaler Inferenz in Matchingverfahren	921
	1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse	924
	1.3 Durchführung der empirischen Analyse	925
	1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen	930
	2 Mathematisch-statistische Grundlagen	931
	3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes	937
	3.1 Zuweisungsmodell	938
	3.2 Matching und Balancierungstests	940
	3.3 Parameterschätzung	944
	4 Häufige Fehler	947
	5 Literaturempfehlungen	949
	Literaturverzeichnis	949
	36 Kausalanalyse mit Paneldaten	951
	1 Einführung in die Paneldatenanalyse	951
	1.1 Kontrafaktische Kausalanalyse und Paneldaten	952
	1.2 Eine intuitive Einführung in Panelregressionsmodelle	954
	1.3 Ein didaktisches Beispiel	956
	2 Eine präzisere Einführung in die Panelregression	959
	2.1 Das Fehlerkomponenten-Modell	960
	2.2 Die Schätzverfahren	960
	2.3 RE- oder FE-Modell?	963
	2.4 Ein Hybrid-Modell	964
	2.5 Panel-robuste Standardfehler	965
	3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit	966
	3.1 Datenaufbereitung	966
	3.2 Schätzergebnisse	968
	3.3 Ein Modell mit Periodeneffekten	970
	3.4 Ein Hybrid-Modell	971
	3.5 Ein Wachstumskurven-Modell	972
	4 Nicht-lineare FE-Modelle	973
	4.1 Nicht-lineare Panelregressionsmodelle	974
	4.2 Das FE-Logit Modell	974
	4.3 FE-Modelle für Ereignisdaten	976
	5 Häufige Fehler	978
	5.1 Suboptimale Panelregressionsmodelle	978
	5.2 Grenzen von FE-Modellen	979
	6 Literaturempfehlungen	981
	Literaturverzeichnis	981
	37 Survival- und Ereignisanalyse	983
	1 Einführung in das Verfahren	983
	1.1 Spezifische Problemstellungen	984
	1.2 Erhebung von Ereignisdaten	986
	1.3 Zensierung von Beobachtungen	987
	2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation	988
	2.1 Verschiedene Ratenmodelle und ihre Schätzung	991
	Sterbetafelmethode und Kaplan-Meier-Schätzung	991
	Das Exponentialmodell	992
	Das Cox-Modell	992
	Das Piecewise-Constant-Modell	993
	Parametrische Modelle der Zeitabhängigkeit	994
	2.2 Ein Beispiel	994
	3 Modellierung von parallelen und interdependenten Prozessen	996
	3.1 Ursachen und zeitabhängige Kovariablen	997
	3.2 Zeit und kausale Wirkungen	998
	3.3 Zeitachse und Ereignisse	998
	3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit	998
	3.5 Zeitliche Form der Entfaltung von Wirkungen	999
	3.6 Das Prinzip der konditionalen Unabhängigkeit	999
	3.7 Ein Anwendungsbeispiel	1000
	4 Häufige Fehler	1001
	5 Literaturempfehlungen	1002
	Literaturverzeichnis	1003
	38 Latente Wachstumskurvenmodelle	1005
	1 Einführung in das Verfahren	1005
	2 Mathematisch-statistische Grundlagen	1009
	3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust	1012
	4 Häufige Fehler	1014
	5 Literaturempfehlungen	1016
	Literaturverzeichnis	1016
	39 Sequenzdatenanalyse	1018
	1 Einführung in die Sequenzdatenanalyse	1018
	1.1 Was ist Sequenzdatenanalyse?	1019
	1.2 Grundlegende Konzepte	1020
	2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung	1024
	2.1 Der Optimal Matching Algorithmus	1024
	2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen	1026
	2.3 Die Diskussion um OM und neuere Entwicklungen	1026
	3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen	1028
	3.1 Datenaufbereitung	1028
	3.2 Datenauswertung	1030
	4 Häufige Fehler	1035
	5 Literaturempfehlungen	1037
	Literaturverzeichnis	1037
	40 Zeitreihenanalyse	1039
	1 Einführung	1039
	2 Deskription und statistisches Modell	1041
	3 Stochastische Prozesse	1042
	4 Nichtstationäre (stochastische) Prozesse	1047
	5 Tests auf „Random Walk“	1049
	6 Zerlegung von Zeitreihen	1053
	7 Interventionsanalyse	1059
	8 Ausreißer-Analyse	1061
	9 Transferfunktions-Modelle	1064
	10 Vektorielle stochastische Prozesse	1068
	11 Schluss	1073
	12 Literaturempfehlungen	1074
	Literaturverzeichnis	1074
	Anhang	1077
	Autorenverzeichnis	1078

Handbuch der sozialwissenschaftlichen Datenanalyse

von: Christof Wolf, Henning Best

Handbuch der sozialwissenschaftlichen Datenanalyse

Kategorien

eBooks