Data Science / Statistik / R Foundation / R / Kategoriale Datenanalyse mit R

R - Kategoriale Datenanalyse mit R

Details

ID 1252619
Klassenraum 3 Tage
Webinar 5 Tage
Methode Vortrag mit Beispielen und Übungen.
Vorwissen Grundlegende Statistikkenntnisse
Zielgruppe Datenanalysten



Die Analyse von Tabellen und kategorialen Daten ist ein großes Gebiet mit verschiedenen Paketen in R. Verschaffen Sie sich mit diesem Statistik-Seminar einen Überblick über logistische Regression, das Logit-Modell, der Kontingenzanalyse und dem verallgemeinerten linearen Modell. Sie werden statitische Analysen in R und RStudio durchführen.



Analysieren Sie mit R zwei- und mehrdimensionale Tabellen und allgemein kategoriale Daten mit einer Vielzahl an statistischen Methoden und R-Paketen.

Services:

  • Mittagessen / Catering
  • Hilfe bei Hotel / Anreise
  • Comelio-Zertifikat
  • Flexibel: Bis 10 Tage vorher kostenlos stornieren

Übersicht

Kontingenztabellen oder Kreuztabellen sind Tabellen, die die absoluten oder relativen Häufigkeiten von Kombinationen bestimmter Merkmalsausprägungen enthalten. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Dieses Seminar zeigt Ihnen, wie Sie mit R kategoriale Daten in solchen Kontingenztabellen analysieren können. Dabei lernen Sie zunächst die wesentlichen Konzepte von kategorialen Daten und ihren diskreten Verteilungen kennen. Danach sehen Sie, wie Sie Tabellen des Aufbaus 2x2 und IxJ visualisieren und analysieren können. Ein weiterer Teil des Seminars beschäftigt sich damit, Modelle für kategoriale Variablen abzuleiten. Dazu zählen das Log-Lineare Modell und das Allgemeine Lineare Modell sowie verschiedene Varianten des Assoziationsmodells. Das letzte Themengebiet ist dann die Analyse von Antwortvariablen mit Hilfe der Logistischen Regression. Die Beispiele werden in R und mit geeigneten R-Paketen vorgeführt und praktisch getestet.

Termine

  • 2020-Nov-02 - Nov-04
  • 2021-Jan-11 - Jan-13
  • 2021-Mar-22 - Mar-24
  • 2021-May-31 - Jun-02

1450 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-11
  • 2021-Jan-18 - Jan-20
  • 2021-Mar-29 - Mar-31
  • 2021-Jun-07 - Jun-09

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-19 - Oct-21
  • 2020-Dec-28 - Dec-30
  • 2021-Mar-08 - Mar-10
  • 2021-May-17 - May-19

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-11
  • 2021-Jan-18 - Jan-20
  • 2021-Mar-29 - Mar-31
  • 2021-Jun-07 - Jun-09

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-11
  • 2021-Jan-18 - Jan-20
  • 2021-Mar-29 - Mar-31
  • 2021-Jun-07 - Jun-09

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-11
  • 2021-Jan-18 - Jan-20
  • 2021-Mar-29 - Mar-31
  • 2021-Jun-07 - Jun-09

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-19 - Oct-21
  • 2020-Dec-28 - Dec-30
  • 2021-Mar-08 - Mar-10
  • 2021-May-17 - May-19

1480 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-19 - Oct-21
  • 2020-Dec-28 - Dec-30
  • 2021-Mar-08 - Mar-10
  • 2021-May-17 - May-19

1550 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-19 - Oct-23
  • 2020-Dec-28 - Jan-01
  • 2021-Mar-08 - Mar-12
  • 2021-May-17 - May-21

950 EUR zzgl. MwSt.

Standort | Anmeldung


Inhalt

Kategoriale Daten

Definition von kategorialen Daten - Verteilungen für kategoriale Variablen: die Binomial- und Multinomial-Verteilungen, die Poisson-Verteilung und die Hypergeometrische Verteilung - Typische Fragestellungen der induktiven Statistik - Statistische Modellierung für kategoriale Daten

Analyse von 2 Variablen

2x2- und IxJ-Tabellen - Abhängigkeit und Unabhängigkeit - Vergleich der Verteilungen - Odds Ratio - Fisher-Test - Residualanalyse - Grafiken für 2 Variablen

Analyse von n Variablen

Verbundene, bedingte und Randwahrscheinlichkeiten - Odds Ratio für 2x2 K Tabellen und höher-dimensionale Tabellen - Analyse von 2x2 K Tabellen - Unabhängigkeit bei 3 Variablen - Grafiken für n Variablen

Log-Lineare Modelle und das Allgemeine Lineare Modell

LL Modell für 2 und 3 Variablen sowie im n-dimensionalen Fall - Modellanpassung und Modellauswahl - Graphen-Modelle - ALM und ihre Schätzung für verbundene Verteilung und die Randverteilungen

Logit Modell und die logistische Regression

Logit-Modell für binäre Antwortvariable - Nominale und ordinale Skala - Mehrstufige Antwortvariable

Assoziationsmodelle

Einführung in die Assoziationsmodelle - Reihen- und Spalten-Effekte - Modellanpassung und Modellauswahl - Assoziationsmodelle für n Variablen

Dozent/in

Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.

Veröffentlichungen
  • Grundlagen empirische Sozialforschung ISBN 978-3-939701-23-1
  • System und Systematik von Fragebögen ISBN 978-3-939701-26-2
  • Oracle SQL ISBN 978-3-939701-41-5
  • SQL Server 2012: Data Mining und multivariate Verfahren ISBN 978-3-939701-85-9
  • SQL und relationale Datenbanken ISBN 978-3-939701-52-1
Projekte

Als Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.

Forschung

Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.