Inhalt
Einführung in R
Aufrufen und Beenden von R - RStudio als Analyseumgebung - Einsatz von RCommander - R und R-Skripte: Daten (Variablen, Vektoren, Matrizen, Tabellen und Data Frames) definieren, filtern und transformieren - Arbeiten mit MS Excel und Text-Dateien für Import/Export - Grafiken und Diagramme für eine und mehrere Variablen erstellen - Mathematische Funktionen - Nutzen von RCommander
Deskriptive Statistik: Eindimensionale Häufigkeitsverteilungen
Häufigkeitsverteilungen und grafische Darstellung bei verschiedenen Skalen - Maßzahlen der Häufigkeit: Mittelwerte (Modus, Zentralwert, Quantile, Arithmetisches / geometrisches / harmonisches Mittel) - Streuungsmaße: Spannweite, Quartilsabstand, Mittlere absolute Abweichung, empirische Standardabweichung, Variationskoeffizient - Formparameter: Schiefemaße, Wölbungsmaße
Induktive Statistik: Wahrscheinlichkeit
Grundlagen: Zufallsexperiment, Ergebnismenge und Ereignis, Zusammengesetzte Ereignisse, Absolute und relative Häufigkeiten - Wahrscheinlichkeitsbegriffe: Klassischer, statistischer und subjektiver Wahrscheinlichkeitsbegriff - Rechnen mit Wahrscheinlichkeiten: Axiome und ihre Folgerungen, Bedingte Wahrscheinlichkeit, Multiplikationssatz, Stochastische Unabhängigkeit, Satz der totalen Wahrscheinlichkeit, Bayessches Theorem
Induktive Statistik: Wahrscheinlichkeitsverteilungen
Zufallsvariablen - Diskrete Verteilungen: Binomialverteilung, Poissonverteilung, Hypergeometrische Verteilung, Geometrische Verteilung - Stetige Verteilungen: Gleichverteilung, Exponentialverteilung, Normalverteilung - Maßzahlen: Erwartungswert, Mathematische Erwartung, Varianz - Einsatz verschiedenen R-Funktionen für Berechnung und grafischer Ausgabe gängiger Verteilungen
Induktive Statistik: Hypothesentests
Einführung in statistisches Testen: Hypothesen, Fehler I. und II. Art, Signifikanz, Power eines Tets - Hypothesentests und Aussagen über den Mittelwert, die Streuung und den Anteilswert - Berechnung von Konfindenzintervallen für statistische Maßzahlen - Tests für eine und zwei Stichproben - Tests auf Normalverteilung - Tests in R und mit RCommander durchführen
Analysen für metrische Daten
Streudiagramm - Korrelation - Lineare Einfachregression - Modelle mit einer und mehreren Variablen in R erstellen - Modellgüte bewerten - Visualisieren der Ergebnisse
Analysen für kategoriale Daten
Faktoren in R definieren - Kontingenztafeln und Kreuztabellierung in R für Zahldaten - Randhäufigkeiten und Prozente - Kontingenzanalyse und der Chi-Quadrat-Test - Maßzahlen für den Zusammenhang - Varianzanalyse (ANOVA)
Dozent/in
Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.
Veröffentlichungen
- Grundlagen empirische Sozialforschung ISBN 978-3-939701-23-1
- System und Systematik von Fragebögen ISBN 978-3-939701-26-2
- Oracle SQL ISBN 978-3-939701-41-5
- SQL Server 2012: Data Mining und multivariate Verfahren ISBN 978-3-939701-85-9
- SQL und relationale Datenbanken ISBN 978-3-939701-52-1
Projekte
Als Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.
Forschung
Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.