R - Kategoriale Datenanalyse mit R

Details

ID 1252619
Dauer 3.0 Tage
Methoden Vortrag mit Beispielen und Übungen.
Vorwissen Grundlegende Statistikkenntnisse
Zielgruppe Datenanalysten

Übersicht

Kontingenztabellen oder Kreuztabellen sind Tabellen, die die absoluten oder relativen Häufigkeiten von Kombinationen bestimmter Merkmalsausprägungen enthalten. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Dieses Seminar zeigt Ihnen, wie Sie mit R kategoriale Daten in solchen Kontingenztabellen analysieren können. Dabei lernen Sie zunächst die wesentlichen Konzepte von kategorialen Daten und ihren diskreten Verteilungen kennen. Danach sehen Sie, wie Sie Tabellen des Aufbaus 2x2 und IxJ visualisieren und analysieren können. Ein weiterer Teil des Seminars beschäftigt sich damit, Modelle für kategoriale Variablen abzuleiten. Dazu zählen das Log-Lineare Modell und das Allgemeine Lineare Modell sowie verschiedene Varianten des Assoziationsmodells. Das letzte Themengebiet ist dann die Analyse von Antwortvariablen mit Hilfe der Logistischen Regression. Die Beispiele werden in R und mit geeigneten R-Paketen vorgeführt und praktisch getestet.

Termine

Wir überarbeiten gerade unsere Webseite und die Seminare. Neue Termine gibt es erst ab 2025. Wir bieten dieses Seminar weiterhin als Inhouse-Seminar für Sie und Ihr Team an.

Comelio Medien

Noch auf der Suche nach weiterführender Literatur? Entdecken Sie passende Fachbücher in unserem Katalog.

Beschreibung

Die Analyse von Tabellen und kategorialen Daten ist ein großes Gebiet mit verschiedenen Paketen in R. Verschaffen Sie sich mit diesem Statistik-Seminar einen Überblick über logistische Regression, das Logit-Modell, der Kontingenzanalyse und dem verallgemeinerten linearen Modell. Sie werden statitische Analysen in R und RStudio durchführen.

Services

  • Mittagessen / Catering
  • Hilfe bei Hotel / Anreise
  • Comelio-Zertifikat
  • Flexibel: Bis einen Tag vorher kostenlos stornieren
Service-Kaffeekanne

Inhalt

Kategoriale Daten
Definition von kategorialen Daten - Verteilungen für kategoriale Variablen: die Binomial- und Multinomial-Verteilungen, die Poisson-Verteilung und die Hypergeometrische Verteilung - Typische Fragestellungen der induktiven Statistik - Statistische Modellierung für kategoriale Daten
Analyse von 2 Variablen
2x2- und IxJ-Tabellen - Abhängigkeit und Unabhängigkeit - Vergleich der Verteilungen - Odds Ratio - Fisher-Test - Residualanalyse - Grafiken für 2 Variablen
Analyse von n Variablen
Verbundene, bedingte und Randwahrscheinlichkeiten - Odds Ratio für 2x2 K Tabellen und höher-dimensionale Tabellen - Analyse von 2x2 K Tabellen - Unabhängigkeit bei 3 Variablen - Grafiken für n Variablen
Log-Lineare Modelle und das Allgemeine Lineare Modell
LL Modell für 2 und 3 Variablen sowie im n-dimensionalen Fall - Modellanpassung und Modellauswahl - Graphen-Modelle - ALM und ihre Schätzung für verbundene Verteilung und die Randverteilungen
Logit Modell und die logistische Regression
Logit-Modell für binäre Antwortvariable - Nominale und ordinale Skala - Mehrstufige Antwortvariable
Assoziationsmodelle
Einführung in die Assoziationsmodelle - Reihen- und Spalten-Effekte - Modellanpassung und Modellauswahl - Assoziationsmodelle für n Variablen

Dozent/in

Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.

Veröffentlichungen

  • Grundlagen empirische Sozialforschung (Comelio Medien)
    978-3-939701-23-1
  • System und Systematik von Fragebögen (Comelio Medien)
    978-3-939701-26-2
  • Oracle SQL (Comelio Medien)
    978-3-939701-41-5
  • SQL Server 2012: Data Mining und multivariate Verfahren (Comelio Medien)
    978-3-939701-85-9
  • SQL und relationale Datenbanken (Comelio Medien)
    978-3-939701-52-1

Projekte

Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.

Forschung

Als Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.