Data Science / Statistik / Statistik / Kategoriale Daten und Logistische Regression

Statistik - Kategoriale Daten und Logistische Regression

Details

ID 1252625
Klassenraum 2 Tage
Webinar 4 Tage
Methode Vortrag mit Beispielen und Übungen.
Vorwissen Allgemeine Kenntnisse der Mathematik
Zielgruppe Datenanalysten



Die Analyse von Tabellen und kategorialen Daten ist ein großes Gebiet mit vielen Werkzeugen. Verschaffen Sie sich mit diesem Statistik-Seminar einen Überblick über logistische Regression, das Logit-Modell und der Kontingenzanalyse.



Analysieren Sie Tabellen und kategoriale Daten mit einer Vielzahl an statistischen Methoden.

Services:

  • Mittagessen / Catering
  • Hilfe bei Hotel / Anreise
  • Comelio-Zertifikat
  • Flexibel: Bis 10 Tage vorher kostenlos stornieren

Übersicht

Die Seminarteilnehmer erhalten eine anwendungsorientierte Einführung in Logit-Modellierung und kategoriale Regression. Das Seminar behandelt Modelle zur Analyse kategorialer Daten. Kategoriale Daten sind Variablen, die eine begrenzte Anzahl von Ausprägungen (Kategorien) haben. Unter logistischer Regression oder Logit-Modell versteht man dann Regressionsanalysen zur (meist multivariaten) Modellierung der Verteilung diskreter abhängiger Variablen. Damit lassen sich Gruppenzugehörigen und Wahrscheinlichkeiten für Ereignisse bestimmen. Bei vielen der in Umfrageforschung und amtlicher Statistik erhobenen Merkmale handelt es sich um kategoriale Daten. In diesem Seminar lernen Sie die Logit-Regression und darauf aufbauende Alternativmodelle kennen. Zusätzlich lernen Sie, Kontingenz-/Kreuztabellen zu untersuchen, um Abhängigkeiten zwischen kategorialen Variablen zu untersuchen.

Termine

  • 2020-Oct-29 - Oct-30
  • 2021-Jan-07 - Jan-08
  • 2021-Mar-18 - Mar-19
  • 2021-May-27 - May-28

1450 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-05 - Nov-06
  • 2021-Jan-14 - Jan-15
  • 2021-Mar-25 - Mar-26
  • 2021-Jun-03 - Jun-04

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-05 - Nov-06
  • 2021-Jan-14 - Jan-15
  • 2021-Mar-25 - Mar-26
  • 2021-Jun-03 - Jun-04

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-22 - Oct-23
  • 2020-Dec-31 - Jan-01
  • 2021-Mar-11 - Mar-12
  • 2021-May-20 - May-21

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-12 - Nov-13
  • 2021-Jan-21 - Jan-22
  • 2021-Apr-01 - Apr-02
  • 2021-Jun-10 - Jun-11

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-29 - Oct-30
  • 2021-Jan-07 - Jan-08
  • 2021-Mar-18 - Mar-19
  • 2021-May-27 - May-28

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-12 - Nov-13
  • 2021-Jan-21 - Jan-22
  • 2021-Apr-01 - Apr-02
  • 2021-Jun-10 - Jun-11

1480 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-05 - Nov-06
  • 2021-Jan-14 - Jan-15
  • 2021-Mar-25 - Mar-26
  • 2021-Jun-03 - Jun-04

1550 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-19 - Oct-22
  • 2020-Dec-28 - Dec-31
  • 2021-Mar-08 - Mar-11
  • 2021-May-17 - May-20

950 EUR zzgl. MwSt.

Standort | Anmeldung


Inhalt

Logistische Regression und Logit-Modell für binäre abhängige Größen

Logit-Modelle für eine metrische Einflussgröße - Modelle für linear spezifizierte Einflussgrößen - Logit-Modelle bei kategorialen Einflussgrößen - Das lineare Logit-Modell ohne Interaktion - Logit-Modell und Alternativen

Schätzung, Modellanpassung und Einflussgrößen

Parameterschätzung für Regressionsmodelle - Anpassungsgüte von Modellen - Residualanalyse - Überprüfung der Relevanz von Einflussgrößen - Devianz-Analyse - Erklärungswert von Modellen

Alternative Modellierung von Response und Einflussgrößen

Konzeptioneller Hintergrund binärer Regressionsmodelle - Modelltypen - Modellierung von Interaktionswirkungen - Abweichung von der Binomialverteilung

Multinominale Modelle für ungeordnete Kategorien

Modellbildung bei mehrkategorialer abhängiger Variable - Das multinominale Logit-Modell - Einfache Verzweigungsmodelle - Modellierung als Wahlmodell der Nutzenmaximierung - Schätzen und Testen

Regression mit ordinaler abhängiger Variable

Das Schwellenwert- oder kumulative Modell - Das sequenzielle Modell - Schätzen und Testen

Zähldaten und die Analyse von Kontingenztafeln: das loglineare Modell

Die Poisson-Verteilung - Poisson-Regression - Poisson-Regression mit Dispersion - Analyse von Kontingenztafeln

Nonparametrische Regression

Glättungsverfahren: Lokale Regression für binäre abhängige Variable, Ansätze mit Penalisierung, Semiparametrische Erweiterung durch das partiell lineare Modell, Generalisierte additive Modell, Schätzalgorithmen - Klassifikations- und Regressionsbäume: Verzweigungen und Verzweigungskriterien, Baumgröße

Kategoriale Prognose und Diskriminanzanalyse

Bayes-Zuordnung als diskriminanzanalytisches Verfahren: Bayes-Zuordnung und Fehlerraten, Fehlklassifikationswahrscheinlichkeiten, Bayes-Regel und Diskriminanzfunktionen, Logit-Modell und normalverteilte Merkmale, Logit-Modell und binäre Merkmale, Kostenoptimale Bayes-Zuordnung - Geschätze Zuordnungsregeln: Stichproben und geschätzte Zuordnungsregeln, Prognosefehler

Dozent/in

Unser Statistik- und Data-Mining-Trainer Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken und als Business Intelligence-Berater. Zu seinen Kunden zählen Marktforschungsunternehmen oder Behörden wie der Deutsche Bundesrat sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung.

Veröffentlichungen
  • Grundlagen empirische Sozialforschung ISBN 978-3-939701-23-1
  • System und Systematik von Fragebögen ISBN 978-3-939701-26-2
  • Oracle SQL ISBN 978-3-939701-41-5
  • SQL Server 2012: Data Mining und multivariate Verfahren ISBN 978-3-939701-85-9
  • SQL und relationale Datenbanken ISBN 978-3-939701-52-1
Projekte

Als Berater und Projektleiter konzipiert Herr Skulschus Business Intelligence-Systeme auf Basis von OLAP und Data Warehouse-Technologien mit MS SQL Server und Oracle mit Berichtskomponenten im Intranet oder MS Excel, statistische Analysen und Data Mining-Modulen. Je nach Aufgabe setzt er R, IBM SPSS oder Minitab ein.

Forschung

Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.