Handbuch der sozialwissenschaftlichen Datenanalyse

Handbuch der sozialwissenschaftlichen Datenanalyse

 

 

 

von: Christof Wolf, Henning Best

VS Verlag für Sozialwissenschaften (GWV), 2011

ISBN: 9783531920382

Sprache: Deutsch

1083 Seiten, Download: 7794 KB

 
Format:  PDF, auch als Online-Lesen

geeignet für: Apple iPad, Android Tablet PC's Online-Lesen PC, MAC, Laptop


 

eBook anfordern

Mehr zum Inhalt

Handbuch der sozialwissenschaftlichen Datenanalyse



  Vorwort 5  
  Inhaltsverzeichnis 6  
  Teil I Einführung 10  
     1 Einführung: Sozialwissenschaftliche Datenanalyse 11  
        1 Moderne Sozialwissenschaft und die Bedeutung der Statistik 11  
        2 Ziele und Zielgruppe des Handbuchs 12  
        3 Themenauswahl 13  
        4 Gliederung und Inhal 14  
        5 Ausblick 14  
        Literaturverzeichnis 15  
     2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik 16  
        1 Einführung 16  
        2 Was heißt Kausalität? 17  
           2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität 18  
           2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen 18  
           2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität 18  
           2.4 Kausalität als „Mechanismus“ 19  
           2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn? 19  
           2.6 Exkurs: Die Logik der Erklärung 20  
           2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität 21  
           2.8 Zum Vergleich der Kausalitäts-Definitionen 23  
        3 Kausalität in sozialwissenschaftlichen Experimenten 24  
        4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression 27  
           4.1 Enthalten Kausalmodelle Kausalaussagen? 27  
           4.2 Regressionsanalyse und kausale Schlüsse 28  
           4.3 Kausalität in anderen multivariaten Verfahren 33  
           4.4 Gibt es Algorithmen für die Ermittlung von Kausalität? 34  
        5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen 36  
        6 Kausalität in Messmodellen 38  
        7 Resümee 41  
        8 Literaturempfehlungen 41  
        Literaturverzeichnis 42  
  Teil II Grundlagen der Datenanalyse 46  
     3 Datengewinnung und Datenaufbereitung 47  
        1 Daten 47  
        2 Formen der Datenerhebung 49  
           2.1 Befragung 49  
              Persönlich-Mündliches Interview 53  
              Schriftliche Befragung 54  
              Telefonbefragung 56  
              Onlinebefragungen 57  
              Entscheidung für eine Befragungsform 60  
           2.2 Beobachtung 61  
        3 Stichprobenziehung 63  
        4 Datenaufbereitung 66  
           4.1 Transkription 66  
           4.2 Kodierung 66  
           4.3 Plausibilisierung 67  
           4.4 Gewichtung 68  
           4.5 Archivierung 68  
        5 Literaturempfehlungen 69  
        Literaturverzeichnis 69  
     4 Uni- und bivariate deskriptive Statistik 71  
        1 Univariate Statistik 71  
           1.1 Lagemaße 71  
              Arithmetische Mittel 71  
              Median (Zentralwert) 72  
              Modalwert 74  
           1.2 Streuungsmaße 74  
              Varianz, Standardabweichung und Variationskoeffizient 75  
              Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung 77  
              Index qualitativer Variation 78  
           1.3 Schiefe 78  
        2 Bivariate Statistik 79  
           2.1 Tabellenanalyse 81  
              Spalten-, Zeilen- und Gesamtprozente 81  
              Prozentuierung und statistische Unabhängigkeit 82  
              Prozentsatzdifferenz 83  
              Odds und Odds-Ratio 84  
              Nominalskalierte Maße: Cramérs V 85  
              Ordinalskalierte Merkmale 87  
           2.2 Metrische Merkmale: Kovarianz und Korrelation 91  
        3 Ausblick 94  
        4 Literaturempfehlungen 94  
        Literaturverzeichnis 94  
     5 Graphische Datenexploration 96  
        1 Einführung 96  
        2 Graphische Methoden für die Datenexploration 98  
           2.1 Einteilungskriterien für graphische Darstellungen 98  
           2.2 Univariate Analysen 99  
              Untersuchung der empirischen Häufigkeitsverteilung 99  
              Vergleich von Verteilungen 108  
              Die Darstellung von Zeitreihen 112  
           2.3 Bivariate Analysen 113  
              Das Anscombe-Quartett 114  
              Streudiagramm 115  
           2.4 Multivariate Analysen 117  
        3 Fehlervermeidung und Hinweise zum praktischen Vorgehen 119  
        4 Literaturempfehlungen 120  
        Anhang 120  
        Literaturverzeichnis 121  
     6 Der Umgang mit fehlenden Werten 122  
        1 Einführung in Techniken zur Kompensation fehlender Werte 122  
           1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit 122  
           1.2 Gewichtung 125  
              Schätzung der Responsewahrscheinlichkeiten 126  
              Gewichten oder nicht? 127  
              Ergänzungen 128  
           1.3 Multiple Imputation 129  
              Voraussetzungen 129  
              Erzeugung multipler Imputationen 130  
              Auswertung multipel imputierter Datensätze 132  
              Ergänzungen 133  
        2 Mathematisch-statistische Grundlagen 134  
           2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit 134  
           2.2 Gewichtung 135  
           2.3 Multiple Imputation 137  
        3 Beispiel: Einkommensgleichung mit fehlenden Werten 140  
        4 Häufige Fehler 144  
        5 Literaturempfehlungen 146  
        Literaturverzeichnis 147  
     7 Gewichtung 148  
        1 Einführung in das Verfahren 148  
        2 Mathematisch-statistische Grundlagen 150  
           2.1 Designgewichtung in komplexen Stichprobenerhebungen 152  
              Schichtung 153  
              Proportionale Aufteilung 154  
              Disproportionale Schichtung 154  
              Klumpenauswahl 155  
              Auswahl mit ungleichen Wahrscheinlichkeiten 156  
           2.2 Kombination von Anpassungs- und Designgewichtung 158  
        3 Gewichtung am Beispiel des ESS 163  
        4 Häufige Fehler 168  
        5 Literaturempfehlungen 168  
        Literaturverzeichnis 168  
     8 Grundlagen des statistischen Schließens 170  
        1 Einführung in die Fragestellung 170  
        2 Statistisches Schätzen 171  
           2.1 Eigenschaften von Schätzern 172  
           2.2 Intervallschätzung 175  
        3 Statistisches Testen 179  
           3.1 Hypothesentests über Konfidenzintervalle 179  
           3.2 Signifikanztests 180  
           3.3 Berücksichtigung der Trennschärfe von Tests 183  
           3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests 185  
        4 Anwendungsfehler und Anwendungsprobleme 187  
           4.1 Fallzahlabhängigkeit 188  
           4.2 Spezifikation der statistischen Fragestellung 189  
           4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse 190  
              Interpretation von Konfidenzintervallen 190  
              Interpretation von Signifikanzen 190  
              Formulierung der Forschungshypothese als Alternativhypothese 191  
              Multiples Testen 191  
              Modell-Fitting 192  
              Stichprobenpläne als Quelle von Interpretationsfehlern 193  
        5 Literaturhinweise 193  
        Literaturverzeichnis 194  
     9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap 195  
        1 Einführung in das Verfahren 195  
        2 Mathematisch-statistische Grundlagen 199  
           2.1 Standardfehler und Konfidenzintervall von ˆ? 199  
              Normale Approximationsmethode 200  
              Perzentil-Methode 200  
              Bias-corrected and accelerated Methode (BCa) 200  
           2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten 202  
        3 Ein Beispiel 203  
           3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation 205  
        4 Häufige Fehler 206  
        5 Literaturempfehlungen 208  
        Literaturverzeichnis 208  
     10 Maximum-Likelihood Schätztheorie 209  
        1 Einführung in das Verfahren 210  
        2 Die Mechanik des Maximum-Likelihood Verfahrens 212  
           2.1 Das ML-Verfahren zur Bestimmung eines Parameters 213  
           2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter 218  
        3 Statistische Eigenschaften der ML-Schätzer 223  
        4 Inferenzstatistik und Modellanpassung 226  
           4.1 Test auf Signifikanz individueller Parameter 227  
           4.2 Test auf Signifikanz mehrerer Parameter 228  
              Likelihood Ratio Test 228  
              Wald-Test 229  
              Lagrange Multiplikatortest 230  
           4.3 Modellgüte 231  
              McFadden R2 232  
              Wald- und LM-basierte R2 233  
              AIC und BIC 234  
        5 Numerische Optimierungsverfahren 235  
        6 Literaturempfehlungen 237  
        Literaturverzeichnis 238  
  Teil III Messen und Skalieren 240  
     11 Reliabilität, Validität, Objektivität 241  
        1 Einführung 241  
        2 Objektivität 242  
           2.1 Durchführungsobjektivität 242  
           2.2 Auswertungsobjektivität 243  
           2.3 Interpretationsobjektivität 244  
        3 Reliabilität 244  
           3.1 Retest-Reliabilität 246  
              Beispiel zur Bestimmung der Retest-Reliabilität 247  
           3.2 Die Paralleltest-Reliabilität 247  
           3.3 Die Split-Half-Reliabilität 248  
              Beispiel zur Bestimmung der Split-Half-Reliabilität 249  
           3.4 Konsistenzanalysen 250  
              Beispiel zur Bestimmung der internen Konsistenz 250  
           3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten 251  
        4 Validität 252  
           4.1 Die Inhaltsvalidität 252  
           4.2 Kriteriumsvalidität 253  
           4.3 Konstruktvalidität 255  
              Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität) 255  
              Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten 256  
              Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil 257  
        5 Vorgehen zur Güteüberprüfung von Skalen 258  
        6 Häufige Fehler 259  
        7 Literaturempfehlungen 259  
        Literaturverzeichnis 260  
     12 Thurstone- und Likertskalierung 261  
        1 Einleitung 261  
        2 Thurstone Skalierung 262  
           2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ) 262  
              Grundlagen des Verfahrens 262  
              Vorgehensweise bei der Skalierung 264  
              Anwendungsbeispiel 266  
           2.2 Die Methode der gleich erscheinenden Intervalle 270  
           2.3 Die Methode der sukzessiven Intervalle (MSI) 272  
              Grundlagen des Verfahrens 272  
              Anwendungsbeispiel 273  
           2.4 Häufige Fehler bei der Thurstone Skalierung 277  
        3 Likertskalierung 277  
           3.1 Grundlagen des Verfahrens 277  
           3.2 Anwendungsbeispiel 279  
           3.3 Häufige Fehler bei der Likert Skalierung 282  
        4 Literaturempfehlungen 282  
        Literaturverzeichnis 282  
     13 Guttman- und Mokkenskalierung 284  
        1 Einleitung 284  
        2 Guttmanskalierung 286  
           2.1 Grundlagen des Verfahrens 286  
              Modellannahmen 288  
              Schätzung von Item- und Personenparametern 289  
              Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern 290  
              Modellprüfung 291  
           2.2 Anwendungsbeispiel 297  
           2.3 Häufige Fehler bei der Guttmanskalierung 299  
        3 Mokkenskalierung 300  
           3.1 Grundlagen des Verfahrens 300  
              Modellprüfung 302  
           3.2 Anwendungsbeispiel 306  
           3.3 Häufige Fehler bei der Mokkenskalierung 308  
        4 Literaturempfehlungen 308  
        Literaturverzeichnis 309  
     14 Item-Response-Theorie 311  
        1 Einführung 312  
        2 Modelle für dichotome Items 313  
           2.1 Das Rasch-Modell 313  
           2.2 Das Birnbaum-Modell 316  
           2.3 Das Modell mit Rateparameter 317  
        3 Modelle für mehrstufig geordnete Items 318  
           3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell) 318  
           3.2 Weitere IRT-Modelle für ordinale Items 320  
        4 Weitere IRT-Modelle 321  
           4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell 321  
        5 Modelltestung und Modellvergleiche 322  
        6 Beispielanwendung 324  
           6.1 Anwendung 1: Kompetenzmessung 324  
           6.2 Anwendung 2: Surveyforschung 326  
        7 Häufige Fehler 330  
        8 Literaturempfehlungen 331  
        Literaturverzeichnis 331  
     15 Hauptkomponentenanalyse und explorative Faktorenanalyse 333  
        1 Einführung in das Verfahren 333  
           1.1 Einsatzmöglichkeiten 333  
           1.2 Die Hauptkomponentenanalyse 336  
              Eine geometrische Perspektive 336  
              Die konkreten Schritte der PCA 340  
              Bestimmung der Komponentenzahl 341  
              Die unrotierte Lösung 343  
              Rotation 344  
              Berechnung von Komponentenwerten 347  
           1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne 348  
        2 Mathematisch-statistische Grundlagen 350  
        3 Ein Anwendungsbeispiel: Vertrauen in Institutionen 354  
        4 Probleme und Erweiterungen 360  
        5 Literaturempfehlungen 363  
        Anhang 364  
        Literaturverzeichnis 364  
     16 Korrespondenzanalyse 366  
        1 Einleitung 366  
        2 Mathematisch-statistische Grundlagen 368  
        3 Ein Beispiel 370  
           3.1 Graphische Darstellung 370  
           3.2 Numerische Darstellung 373  
        4 Erweiterungen der Korrespondenzanalyse 376  
           4.1 Zusammengesetzte Tabellen 376  
           4.2 Multiple Korrespondenzanalyse 378  
           4.3 Aktive und passive Merkmale 382  
           4.4 Andere Datenformate 384  
        5 Häufige Fehler 385  
        6 Diskussion 386  
        7 Literaturempfehlungen 386  
        Literaturverzeichnis 387  
     17 Multidimensionale Skalierung 389  
        1 Einführung in die MDS 389  
           1.1 Die MDS als psychologisches Modell 390  
           1.2 Die MDS zur Exploration von Datenstrukturen 392  
        2 Mathematische Grundlagen der MDS 393  
           2.1 Güte einer MDS-Lösung 393  
           2.2 Bewertung des Stress 395  
           2.3 MDS-Modelle 397  
           2.4 MDS-Algorithmen 400  
           2.5 Konfirmatorische MDS 400  
        3 Häufige Fehler 403  
           3.1 Degenerierte Lösungen in der ordinalen MDS 403  
           3.2 Falsche Polung der Proximitäten 405  
           3.3 Fehlbewertung von Stress 406  
           3.4 Fehler beim Vergleich verschiedener MDS-Lösungen 407  
           3.5 Mechanische Interpretation „der“ Dimensionen 409  
           3.6 Behandlung störender Punkte 412  
           3.7 Überinterpretation von Dimensionsgewichten 413  
        4 Literaturempfehlungen 413  
        Anhang 414  
        Literaturverzeichnis 415  
  Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen 417  
     18 Analyse kategorialer Daten 418  
        1 Einführung in das Verfahren 418  
        2 Mathematisch-statistische Grundlagen 430  
        3 Ein Beispiel 440  
        4 Häufige Fehler 448  
        5 Literaturempfehlungen 450  
        Literaturverzeichnis 450  
     19 Varianz- und Kovarianzanalyse 452  
        1 Einführung in das Verfahren 452  
           1.1 Vergleich von zwei Gruppen 454  
              Modellgleichung 455  
              Hypothesen 455  
              Quadratsummen 456  
              Freiheitsgrade 457  
              Allgemeine Teststatistik 457  
              Annahmen 459  
              Exkurs: Mittlere Quadratsummen 460  
           1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse 461  
           1.3 Mehrfaktorielle Varianzanalyse 462  
              Modellgleichung 462  
              Hypothesen 463  
              Quadratsummen 463  
              Freiheitsgrade 464  
              Teststatistik 465  
              Annahmen 465  
           1.4 Kovarianzanalyse 466  
              Modellgleichung 467  
              ANOVA versus ANCOVA 467  
           1.5 Effektstärke 468  
           1.6 Teststärke 471  
        2 Mathematisch-statistische Grundlagen 472  
           2.1 ANOVA und ANCOVA als Spezialfälle des ALM 473  
           2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM 477  
        3 Ein Beispiel 480  
           3.1 Vergleich von zwei Gruppen 480  
           3.2 Vergleich von mehr als zwei Gruppen 481  
           3.3 Mehrfaktorielle ANOVA 482  
           3.4 Kovarianzanalyse 484  
           3.5 Annahmen der Varianz- und Kovarianzanalyse 484  
           3.6 Teststärke 488  
        4 Häufige Fehler – eine Checkliste 488  
        5 Literaturempfehlungen 489  
        Literaturverzeichnis 489  
     20 Diskriminanzanalyse 491  
        1 Einführung in das Verfahren 491  
           1.1 Zielsetzung und Anwendungsmöglichkeiten 491  
           1.2 Problemstellung und Prämissen 493  
           1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren 495  
           1.4 Vorgehensweise 497  
              Festlegung des Untersuchungsdesigns 497  
              Extraktion der Diskriminanzfunktion(en) 498  
              Evaluation der Diskriminanzfunktion(en) 500  
              Merkmalsselektion und Klassifikation neuer Objekte 502  
        2 Mathematisch-statistische Grundlagen 503  
           2.1 Ermittlung der Diskriminanzfunktion (en) 503  
           2.2 Prüfkriterien der Diskriminanz 507  
           2.3 Klassifikationskonzepte 508  
              Distanzkonzept 509  
              Wahrscheinlichkeitskonzept 510  
              Konzept der Klassifikationsfunktionen nach Fisher 510  
        3 Anwendungsbeispiel 511  
        4 Häufige Fehler 515  
        5 Literaturempfehlungen 517  
        Literaturverzeichnis 518  
     21 Clusteranalyse 520  
        1 Einführung in das Verfahren 520  
           1.1 Was ist Clusteranalyse und was sind überhaupt Cluster? 521  
           1.2 Clusterstruktur 522  
           1.3 Algorithmen 522  
           1.4 Variablenräume 523  
           1.5 Agglomerative Verfahren 524  
              Ähnlichkeitsmaß, Distanz und Index 524  
              Fusionswerte und Dendrogramme 525  
           1.6 Wahl der Metriken und Agglomerationsverfahren 526  
           1.7 K-Means (Clusterzentrenanalyse) 527  
           1.8 TwoStep-Clusteranalyse 529  
        2 Mathematisch-statistische Grundlagen 530  
           2.1 Hierarchisch-agglomerative Verfahren 530  
              Ähnlichkeitsmaße und Distanzen 530  
              Gewichtung und Standardisierung von Variablen 532  
              Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten 532  
              Dendrogramm und Ultrametrik 533  
           2.2 K-Means 534  
           2.3 TwoStep-Verfahren 534  
              Die beiden Stufen der Clusterung 534  
              Anzahl der Cluster 535  
              Tabellen und Graphiken zur Beschreibung der Cluster 536  
        3 Beispiel 536  
           3.1 Daten- und Variablenauswahl 536  
           3.2 Analyse 537  
           3.3 Verbesserung der Clusterlösung 540  
              Variablenauswahl 540  
              Eliminieren von „Ausreißern“ 540  
              Optimierung der Lösung durch eine K-Means-Analyse 541  
           3.4 Überprüfen der Clusterlösung 542  
           3.5 TwoStep-Clusteranalyse 543  
        4 Häufige Fehler 545  
        5 Literaturempfehlungen 546  
        Literaturverzeichnis 547  
     22 Analyse latenter Klassen 548  
        1 Einführung in das Verfahren 548  
        2 Mathematisch-statistische Grundlagen 550  
           2.1 Modellansatz 550  
           2.2 Parameterschätzung 551  
           2.3 Computerprogramme 553  
        3 Ein Beispiel 555  
           3.1 Daten 555  
           3.2 Zahl der latenten Klassen 555  
           3.3 Lokale Unabhängigkeit 559  
           3.4 Inhaltliche Interpretierbarkeit 560  
           3.5 Stabilität 562  
           3.6 Formale Validitätsprüfung durch Validitätsindizes 564  
           3.7 Kriterienbezogene Validitätsprüfung 564  
        4 Häufige Fehler 566  
        5 Alternativen 567  
        6 Literaturempfehlungen 568  
        Literaturverzeichnis 569  
     23 Netzwerkanalyse 570  
        1 Einführung 570  
        2 Darstellung der Verfahren 575  
           2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden 576  
              Dyaden 577  
              Triaden 578  
              Triadische Umgebungen einzelner Knoten 579  
           2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung 582  
           2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten 586  
              Cliquen und Clans 587  
              k-Plexe und k-Cores 588  
              Zusammenhangs-Komponenten 588  
              Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen 589  
        3 Ein Beispiel 589  
           3.1 Daten 589  
           3.2 Zielsetzungen 591  
           3.3 Erstellung des Datensatzes 592  
        4 Literaturempfehlungen 596  
        Literaturverzeichnis 597  
  Teil V Regressionsverfahren für Querschnittsdaten 599  
     24 Lineare Regressionsanalyse 600  
        1 Einführung 600  
        2 Mathematisch-statistische Grundlagen 605  
           2.1 Das allgemeine Modell 605  
           2.2 Die Identifikation der Regressionskoeffizienten 606  
           2.3 Annahmen der Kleinst-Quadrat-Methode 608  
           2.4 Die Bestimmung der Modellgüte 610  
           2.5 Die statistische Absicherung der Regressionsergebnisse 612  
           2.6 Die Interpretation der Regressionskoeffizienten 616  
           2.7 Standardisierte Regressionskoeffizienten und ihre Probleme 618  
        3 Ein Beispiel 621  
           3.1 Zur Operationalisierung 621  
           3.2 Ergebnisse 622  
        4 Häufige Fehler 628  
        5 Literaturhinweise 630  
        Literaturverzeichnis 630  
     25 Lineare Regression: Modellannahmen und Regressionsdiagnostik 632  
        1 Einführung 632  
           1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen 633  
           1.2 Regressionsdiagnostik: ein erster Einblick 635  
        2 Mathematisch-statistische Grundlagen 638  
           2.1 Annahmen der linearen Regressionsanalyse 638  
           2.2 Grundlagen und Instrumente der Regressionsdiagnostik 645  
              Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik 645  
              Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells 646  
              Diagnostik zu potenziell einflussreichen Untersuchungseinheiten 652  
        3 Regressionsdiagnostik am Beispiel 655  
           3.1 Datengrundlage und Regressionsmodell 655  
           3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel 656  
           3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel 661  
        4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen 665  
        5 Literaturempfehlungen 666  
        Anhang 667  
        Literaturverzeichnis 667  
     26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines 669  
        1 Einführung 669  
        2 Interaktionseffekte, Polynome und Splines 670  
           2.1 Nicht-Additivität: Interaktionseffekte 670  
           2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation 673  
           2.3 Nicht-Linearität: Polynome und Splines 674  
           2.4 Polynome 675  
           2.5 Splines 677  
        3 Tests auf Gruppenunterschiede und Nicht-Linearität 681  
        4 Anwendungsbeispiel I: Interaktionseffekte 683  
        5 Anwendungsbeispiel II: Polynome und Slopes 689  
        6 Häufige Fehler 696  
        7 Literaturempfehlungen 697  
        Literaturverzeichnis 697  
     27 Robuste Regression 699  
        1 Einführung in das Verfahren 699  
        2 Mathematisch-statistische Grundlagen 709  
           2.1 Der Kleinste-Quadrate-Schätzer 709  
           2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer 710  
              Erwartungstreue, Konsistenz und Effizienz 710  
              Relative Effizienz 711  
              Einfluss-Funktion, Bruchpunkt und maximale Verzerrung 712  
              Zusammenfassung 713  
           2.3 M-Schätzer 713  
              Berechnung von M-Schätzern 717  
              Bruchpunkt von M-Schätzern 719  
              Bounded-Influence-Schätzer 719  
           2.4 High-Breakdown-Schätzer 720  
              LMS- und LTS-Schätzer 720  
              S-Schätzer 721  
              MM-Schätzer 722  
        3 Ein Beispiel 723  
        4 Literaturempfehlungen 729  
        Literaturverzeichnis 730  
     28 Mehrebenenanalyse mit Querschnittsdaten 733  
        1 Einführung in das Verfahren 733  
        2 Mathematisch-statistische Grundlagen 741  
           2.1 Die Modellklassen der Mehrebenenanalyse 743  
              Das Random-Intercept-Only-Modell (R-I-O-M) 743  
              Das Random-Intercept-Modell (R-I-M) 744  
              Random-Intercept-Random-Slope-Modell (R-I-R-S-M) 744  
              Das Intercept-as-Outcome-Modell (I-as-O-M) 745  
              Das Random-Coefficient-Modell (R-C-M) 746  
           2.2 Beurteilung der Anpassung des Mehrebenenmodells 747  
           2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation 749  
              Grand-Mean-Zentrierung 749  
              Group-Mean-Zentrierung 750  
           2.4 Standardisierung der kontextspezifischen und Populationsschätzer 752  
           2.5 Besonderheiten des Erhebungsdesigns 754  
        3 Ein Beispiel – Die deutsche PISA 2006 Studie 755  
        4 Häufige Fehler 763  
        5 Literaturempfehlungen 764  
        Literaturverzeichnis 765  
     29 Strukturgleichungsmodelle 767  
        1 Einführung in das Verfahren 767  
           1.1 Ausgangspunkt: Regressions- und Pfadmodell 768  
           1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen 769  
           1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle 771  
           1.4 Das allgemeine Strukturgleichungsmodell 773  
              Modellevaluation 775  
              Modellvergleich 776  
              Modellsparsamkeit 777  
           1.5 Spezielle Modellvarianten 778  
              Modelle für mehrere Gruppen (Multiple Gruppenvergleiche) 778  
              Längsschnittmodelle 778  
              Modelle mit Interaktionstermen 778  
              Die Behandlung fehlender Werte 779  
        2 Mathematisch-statistische Grundlagen 779  
           2.1 Ableitung der Elemente der Kovarianzmatrix ? 779  
           2.2 Schätzung der Parameter 780  
        3 Ein Beispiel 783  
           3.1 Messung der latenten Konstrukte 785  
           3.2 Messmodell der latenten endogenen Variablen 785  
           3.3 Messmodell der latenten exogenen Variablen 785  
           3.4 Überprüfung der Messmodelle 786  
           3.5 Intervenierende Variablen 788  
           3.6 Strukturgleichungsmodell 788  
        4 Häufige Fehler 790  
        5 Literaturempfehlungen 792  
        Anhang 793  
        Literaturverzeichnis 794  
     30 Regression mit unbekannten Subpopulationen 797  
        1 Einführung in das Verfahren 797  
        2 Mathematisch-statistische Grundlagen 799  
           2.1 Spezifikation 800  
           2.2 Schätzung 805  
           2.3 Test auf die Anzahl der Komponenten 807  
           2.4 Anpassungsindizes 808  
        3 Ein Beispiel 808  
        4 Häufige Fehler 816  
        5 Literaturempfehlungen 816  
        Literaturverzeichnis 817  
     31 Logistische Regression 818  
        1 Einführung in das Verfahren 818  
           1.1 Das lineare Wahrscheinlichkeitsmodell 819  
           1.2 Die logistische Regression 820  
           1.3 Interpretation der Koeffizienten 822  
        2 Mathematisch-statistische Grundlagen 825  
           2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable 825  
              Logit-Regression 825  
              Probit-Regression 827  
           2.2 Schätzung 827  
           2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität 828  
              Standardisierte Koeffizienten 829  
              Durchschnittliche marginale Effekte 830  
           2.4 Interaktionseffekte 831  
           2.5 Statistische Inferenz 833  
           2.6 Goodness of fit und Modellvergleich 834  
        3 Ein Beispiel 835  
        4 Häufige Fehler 843  
        5 Literaturempfehlungen 844  
        Literaturverzeichnis 845  
     32 Multinomiale und ordinale Regression 846  
        1 Einführung in das Verfahren 846  
           1.1 Von der binären zur multinomialen logistischen Regression 847  
           1.2 Wahrscheinlichkeiten, Odds und Logits 848  
           1.3 Modellschätzung und statistische Tests 852  
              Besteht ein Zusammenhang? 853  
              Wie stark ist ein Zusammenhang? 853  
              Wie stark sind die relativen Effekte der erklärenden Variablen? 854  
           1.4 Logistische Regression bei einer ordinalen abhängigen Variablen 855  
           1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression 857  
        2 Mathematisch-Statistische Grundlagen 859  
           2.1 Schätzung 859  
           2.2 Statistische Inferenz 860  
           2.3 Modellanpassung 861  
           2.4 Weiterführendes zu Regressionskoeffizienten 862  
              Standardisierte Koeffizienten im ordinalen Regressionsmodell 862  
              Umrechnen der Referenzkategorie im multinomialen Regressionsmodell 862  
        3 Anwendungsbeispiel 863  
           3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression 863  
           3.2 Bildungsabschluss im ordinalen Logitmodell 870  
        4 Häufige Fehler 873  
        5 Literaturempfehlungen 877  
        Literaturverzeichnis 877  
     33 Regression für Zählvariablen 878  
        1 Einführung in das Verfahren 878  
           1.1 Poisson und negative Binomialverteilung 879  
           1.2 Regressionsmodellierung 880  
              Strukturkomponente 880  
              Strukturkomponente: lineare und nichtlineare Prädiktoren 881  
              Verteilungskomponente 883  
              Inferenz 883  
        2 Mathematisch-statistische Grundlagen 884  
           2.1 Poissonmodell 884  
              Maximum-Likelihood-Schätzung 884  
              Parameter-Tests 885  
              Devianz und Anpassungstests 887  
           2.2 Quasi-Poissonmodell 888  
           2.3 Modell der negativen Binomialverteilung 889  
        3 Ein Beispiel 889  
        4 Häufige Fehler 893  
        5 Literaturempfehlungen 894  
        Literaturverzeichnis 894  
     34 Graphische Darstellung regressionsanalytischer Ergebnisse 896  
        1 Einführung in das Verfahren 896  
        2 Grundlagen der graphischen Darstellung 897  
        3 Beispiele 900  
           3.1 Streudiagramm- bzw. Scatterplot-Matrix 900  
           3.2 Median- und Mean-Regression 902  
           3.3 Lineare Regression: Graphische Darstellung der Koeffizienten 903  
           3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots) 905  
           3.5 Logistische Regression: Conditional-Effect-Plots 908  
           3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots 911  
        4 Häufige Fehler 915  
        5 Rückblick 916  
        6 Literaturempfehlungen 917  
        Literaturverzeichnis 918  
  Teil VI Analyse von zeitbezogenen Daten 919  
     35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren 920  
        1 Einführung in das Verfahren 920  
           1.1 Grundannahmen kausaler Inferenz in Matchingverfahren 921  
           1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse 924  
           1.3 Durchführung der empirischen Analyse 925  
           1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen 930  
        2 Mathematisch-statistische Grundlagen 931  
        3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes 937  
           3.1 Zuweisungsmodell 938  
           3.2 Matching und Balancierungstests 940  
           3.3 Parameterschätzung 944  
        4 Häufige Fehler 947  
        5 Literaturempfehlungen 949  
        Literaturverzeichnis 949  
     36 Kausalanalyse mit Paneldaten 951  
        1 Einführung in die Paneldatenanalyse 951  
           1.1 Kontrafaktische Kausalanalyse und Paneldaten 952  
           1.2 Eine intuitive Einführung in Panelregressionsmodelle 954  
           1.3 Ein didaktisches Beispiel 956  
        2 Eine präzisere Einführung in die Panelregression 959  
           2.1 Das Fehlerkomponenten-Modell 960  
           2.2 Die Schätzverfahren 960  
           2.3 RE- oder FE-Modell? 963  
           2.4 Ein Hybrid-Modell 964  
           2.5 Panel-robuste Standardfehler 965  
        3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit 966  
           3.1 Datenaufbereitung 966  
           3.2 Schätzergebnisse 968  
           3.3 Ein Modell mit Periodeneffekten 970  
           3.4 Ein Hybrid-Modell 971  
           3.5 Ein Wachstumskurven-Modell 972  
        4 Nicht-lineare FE-Modelle 973  
           4.1 Nicht-lineare Panelregressionsmodelle 974  
           4.2 Das FE-Logit Modell 974  
           4.3 FE-Modelle für Ereignisdaten 976  
        5 Häufige Fehler 978  
           5.1 Suboptimale Panelregressionsmodelle 978  
           5.2 Grenzen von FE-Modellen 979  
        6 Literaturempfehlungen 981  
        Literaturverzeichnis 981  
     37 Survival- und Ereignisanalyse 983  
        1 Einführung in das Verfahren 983  
           1.1 Spezifische Problemstellungen 984  
           1.2 Erhebung von Ereignisdaten 986  
           1.3 Zensierung von Beobachtungen 987  
        2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation 988  
           2.1 Verschiedene Ratenmodelle und ihre Schätzung 991  
              Sterbetafelmethode und Kaplan-Meier-Schätzung 991  
              Das Exponentialmodell 992  
              Das Cox-Modell 992  
              Das Piecewise-Constant-Modell 993  
              Parametrische Modelle der Zeitabhängigkeit 994  
           2.2 Ein Beispiel 994  
        3 Modellierung von parallelen und interdependenten Prozessen 996  
           3.1 Ursachen und zeitabhängige Kovariablen 997  
           3.2 Zeit und kausale Wirkungen 998  
           3.3 Zeitachse und Ereignisse 998  
           3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit 998  
           3.5 Zeitliche Form der Entfaltung von Wirkungen 999  
           3.6 Das Prinzip der konditionalen Unabhängigkeit 999  
           3.7 Ein Anwendungsbeispiel 1000  
        4 Häufige Fehler 1001  
        5 Literaturempfehlungen 1002  
        Literaturverzeichnis 1003  
     38 Latente Wachstumskurvenmodelle 1005  
        1 Einführung in das Verfahren 1005  
        2 Mathematisch-statistische Grundlagen 1009  
        3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust 1012  
        4 Häufige Fehler 1014  
        5 Literaturempfehlungen 1016  
        Literaturverzeichnis 1016  
     39 Sequenzdatenanalyse 1018  
        1 Einführung in die Sequenzdatenanalyse 1018  
           1.1 Was ist Sequenzdatenanalyse? 1019  
           1.2 Grundlegende Konzepte 1020  
        2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung 1024  
           2.1 Der Optimal Matching Algorithmus 1024  
           2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen 1026  
           2.3 Die Diskussion um OM und neuere Entwicklungen 1026  
        3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen 1028  
           3.1 Datenaufbereitung 1028  
           3.2 Datenauswertung 1030  
        4 Häufige Fehler 1035  
        5 Literaturempfehlungen 1037  
        Literaturverzeichnis 1037  
     40 Zeitreihenanalyse 1039  
        1 Einführung 1039  
        2 Deskription und statistisches Modell 1041  
        3 Stochastische Prozesse 1042  
        4 Nichtstationäre (stochastische) Prozesse 1047  
        5 Tests auf „Random Walk“ 1049  
        6 Zerlegung von Zeitreihen 1053  
        7 Interventionsanalyse 1059  
        8 Ausreißer-Analyse 1061  
        9 Transferfunktions-Modelle 1064  
        10 Vektorielle stochastische Prozesse 1068  
        11 Schluss 1073  
        12 Literaturempfehlungen 1074  
        Literaturverzeichnis 1074  
  Anhang 1077  
  Autorenverzeichnis 1078  

Kategorien

Service

Info/Kontakt

  Info
Hier gelangen Sie wieder zum Online-Auftritt Ihrer Bibliothek