Statistik - Analyse kategorialer Daten (1015704)

Druckansicht
  • Dauer:
    2 Tage
  • Zielgruppe:
    Information Workers
  • Vorkenntnisse:
    Allgemeine Kenntnisse der Mathematik
  • Methode:
    Vortrag mit Beispielen und Übungen.
  • Typ:
    Öffentliches Seminar / Inhouse
  • Download
    Anmeldeformular | AGB | Info-Broschüre
Themen:
Die Seminarteilnehmer erhalten eine anwendungsorientierte Einführung in Logit-Modellierung und kategoriale Regression. Das Seminar behandelt Modelle zur Analyse kategorialer Daten. Kategoriale Daten sind Variablen, die eine begrenzte Anzahl von Ausprägungen (Kategorien) haben. Bei vielen der in Umfrageforschung und amtlicher Statistik erhobenen Merkmale handelt es sich um kategoriale Daten.

Inhalte

A. Logistische Regression und Logit-Modell für binäre abhängige Größen

Logit-Modelle für eine metrische Einflussgröße - Modelle für linear spezifizierte Einflussgrößen - Logit-Modelle bei kategorialen Einflussgrößen - Das lineare Logit-Modell ohne Interaktion - Logit-Modell und Alternativen

B. Schätzung, Modellanpassung und Einflussgrößen

Parameterschätzung für Regressionsmodelle - Anpassungsgüte von Modellen - Residualanalyse - Überprüfung der Relevanz von Einflussgrößen - Devianz-Analyse - Erklärungswert von Modellen

C. Alternative Modellierung von Response und Einflussgrößen

Konzeptioneller Hintergrund binärer Regressionsmodelle - Modelltypen - Modellierung von Interaktionswirkungen - Abweichung von der Binomialverteilung

C. Multinominale Modelle für ungeordnete Kategorien

Modellbildung bei mehrkategorialer abhängiger Variable - Das multinominale Logit-Modell - Einfache Verzweigungsmodelle - Modellierung als Wahlmodell der Nutzenmaximierung - Schätzen und Testen

D. Regression mit ordinaler abhängiger Variable

Das Schwellenwert- oder kumulative Modell - Das sequenzielle Modell - Schätzen und Testen

E. Zähldaten und die Analyse von Kontingenztafeln: das loglineare Modell

Die Poisson-Verteilung - Poisson-Regression - Poisson-Regression mit Dispersion - Analyse von Kontingenztafeln

F. Nonparametrische Regression

Glättungsverfahren: Lokale Regression für binäre abhängige Variable, Ansätze mit Penalisierung, Semiparametrische Erweiterung durch das partiell lineare Modell, Generalisierte additive Modell, Schätzalgorithmen - Klassifikations- und Regressionsbäume: Verzweigungen und Verzweigungskriterien, Baumgröße

G. Kategoriale Prognose und Diskriminanzanalyse

Bayes-Zuordnung als diskriminanzanalytisches Verfahren: Bayes-Zuordnung und Fehlerraten, Fehlklassifikationswahrscheinlichkeiten, Bayes-Regel und Diskriminanzfunktionen, Logit-Modell und normalverteilte Merkmale, Logit-Modell und binäre Merkmale, Kostenoptimale Bayes-Zuordnung - Geschätze Zuordnungsregeln: Stichproben und geschätzte Zuordnungsregeln, Prognosefehler

Dozent:
Dr. Ralf Klinkenberg studierte Informatik an der Universität Dortmund, war dort von 1998 bis 2003 wissenschaftlicher Mitarbeiter und dann Doktorand am Lehrstuhl für Künstliche Intelligenz. Seine Interessen liegen im Bereich des maschinellen Lernens, des Data Mining und der Wissensentdeckung (Knowledge Discovery). Er arbeitet heute als Berater für Fragestellung aus den Bereichen Data Mining und Data Warehousing. Zu seinen zahlreichen wissenchaftlichen Veröffentlichungen gehört eine Reihe von Aufsätzen in wissenschaftlichen Magazinen zu den Themen Data Mining und Datenauswertung.
Marco Skulschus studierte Ökonomie in Wuppertal und Paris. Er arbeitet als Berater und Projektleiter in Data Warehousing- und Data Mining-Projekten für Unternehmen und staatliche Organisationen. Zu seinen Veröffentlichungen im Bereich empirische Sozialforschung gehört eine dreibändige Reihe zu Fragebogen-Systemen und innovativen mehrdimensionalen Frage-/Antwort-Darstellungen wie "Grundlagen empirische Sozialforschung, Befragung und Fragebogen im Unternehmen" (ISBN 978-3-939701-23-1).