Data Science / Statistik / R Foundation / R / Deskriptive und induktive Statistik mit R

R - Deskriptive und induktive Statistik mit R



ID 1252613
Klassenraum 3 Tage
Webinar 5 Tage
Methode Vortrag mit Beispielen und Übungen.
Vorwissen Allgemeine Kenntnisse der Mathematik
Zielgruppe Datenanalysten


  • Daten beschreiben, darstellen und zusammenfassen
  • Statistische Modelle für Prognosen und Erklärungen mit der linearen Regression aufbauen
  • Wahrscheinlichkeitstheorie verstehen und anwenden
  • Eigenschaften von Daten prüfen und mit Hypothesentests nachweisen
  • Daten mit R bearbeiten


Datensätze beschreiben
Lernen Sie, mit Lage- und Streuungsmaßen Datensätze zu beschreiben
Zusammenhängen aufdecken
Weisen Sie Zusammenhänge zwischen Datenreihen nach
Statistische Modelle entwickeln
Verwenden Sie Regression, um Daten in Modellen zu erklären
Rechnen mit Wahrscheinlichkeiten
Setzen Sie induktive Statistik für Wahrscheinlichkeiten ein
Hypothesen testen und nachweisen
Sehen Sie, wie Sie Hypothesen über die Grundgesamtheit prüfen
Wahrscheinlichkeitsverteilungen kennenlernen
Lernen Sie gängige Verteilungen kennen und nutzen
Schlussfolgerungen über die Grundgesamtheit treffen
Leiten Sie aus der Stichprobe Eigenschaften über die Grundgesamtheit ab



Nutzen Sie R für die deskriptive und induktive Datenanalyse und beschreiben Sie Daten, weisen Sie Eigenschaften nach und prüfen Hypothesen.



Sie erhalten das von Ihrem Dozenten Marco Skulschus veröffentlichte Fachbuch.

Services:

  • Mittagessen / Catering
  • Hilfe bei Hotel / Anreise
  • Comelio-Zertifikat
  • Flexibel: Bis 10 Tage vorher kostenlos stornieren

Übersicht

R ist eine freie und damit kostenlose Programmiersprache für statistisches Rechnen und statistische Grafiken. R gilt zunehmend als die statistische Standardsprache sowohl im kommerziellen als auch im wissenschaftlichen Bereich. Der Funktionsumfang von R kann durch eine Vielzahl von Paketen erweitert und an spezifische statistische Problemstellungen angepasst werden. Dieses Seminar zeigt Ihnen zunächst, wie sie mit R grundsätzlich arbeiten können und Daten lesen und schreiben sowie Grafiken erzeugen können. Im zweiten Teil beschäftigen Sie sich mit deskriptiver Statistik, d.h. statistischen Lage- und Streuungsmaßen für metrische Daten und Korrelation sowie Kennzahlen für kategoriale Daten. Im dritten Teil lernen Sie die Theorie der Wahrscheinlichkeit sowie die gängigen statistischen Standard-Verteilungen kennen. Danach lernen Sie, typische Fragestellungen für kategoriale und metrische Daten mit Hilfe der induktiven Statistik zu beantworten und so von der Stichprobe auf die Grundgesamtheit zu schließen. Im letzten Teil erstellen Sie statistische Modelle und komplexe Analysen mit Hilfe der Regressionsanalyse, der Varianzanalyse und auch der Clusteranalyse.

Termine

  • 2020-Oct-19 - Oct-21
  • 2020-Dec-28 - Dec-30
  • 2021-Mar-08 - Mar-10
  • 2021-May-17 - May-19

1450 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-02 - Nov-04
  • 2021-Jan-11 - Jan-13
  • 2021-Mar-22 - Mar-24
  • 2021-May-31 - Jun-02

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-26 - Oct-28
  • 2021-Jan-04 - Jan-06
  • 2021-Mar-15 - Mar-17
  • 2021-May-24 - May-26

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-19 - Oct-21
  • 2020-Dec-28 - Dec-30
  • 2021-Mar-08 - Mar-10
  • 2021-May-17 - May-19

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-26 - Oct-28
  • 2021-Jan-04 - Jan-06
  • 2021-Mar-15 - Mar-17
  • 2021-May-24 - May-26

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-02 - Nov-04
  • 2021-Jan-11 - Jan-13
  • 2021-Mar-22 - Mar-24
  • 2021-May-31 - Jun-02

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-02 - Nov-04
  • 2021-Jan-11 - Jan-13
  • 2021-Mar-22 - Mar-24
  • 2021-May-31 - Jun-02

1480 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-26 - Oct-28
  • 2021-Jan-04 - Jan-06
  • 2021-Mar-15 - Mar-17
  • 2021-May-24 - May-26

1550 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Oct-26 - Oct-30
  • 2021-Jan-04 - Jan-08
  • 2021-Mar-15 - Mar-19
  • 2021-May-24 - May-28

950 EUR zzgl. MwSt.

Standort | Anmeldung


Inhalt

Einführung in R

Aufrufen und Beenden von R - Fragebogen und Kodierung - Variablen, Vektoren, Matrizen und Tabellen - Data Frames: Ansprechen einzelner Variablen, Filtern von Fällen, Transformation von Daten - Arbeiten mit MS Excel und Text-Dateien für Import/Export - Grafiken und Diagramme erstellen

Deskriptive Statistik: Eindimensionale Häufigkeitsverteilungen

Häufigkeitsverteilungen und grafische Darstellung bei verschiedenen Skalen - Maßzahlen der Häufigkeit: Mittelwerte (Modus, Zentralwert, Quantile, Arithmetisches / geometrisches / harmonisches Mittel - Streuungsmaße: Spannweite, Quartilsabstand, Mittlere absolute Abweichung, empirische Standardabweichung, Variationskoeffizient - Formparameter: Schiefemaße, Wölbungsmaße

Induktive Statistik: Wahrscheinlichkeitstheorie

Grundlagen: Zufallsexperiment, Ergebnismenge und Ereignis, Zusammengesetzte Ereignisse, Absolute und relative Häufigkeiten - Wahrscheinlichkeitsbegriffe: Klassischer, statistischer und subjektiver Wahrscheinlichkeitsbegriff - Rechnen mit Wahrscheinlichkeiten: Axiome und ihre Folgerungen, Bedingte Wahrscheinlichkeit, Multiplikationssatz, Stochastische Unabhängigkeit, Satz der totalen Wahrscheinlichkeit, Bayessches Theorem

Induktive Statistik: Wahrscheinlichkeitsverteilungen

Zufallsvariablen - Diskrete Verteilungen: Binomialverteilung, Poissonverteilung, Hypergeometrische Verteilung, Geometrische Verteilung - Stetige Verteilungen: Gleichverteilung, Exponentialverteilung, Normalverteilung - Maßzahlen: Erwartungswert, Mathematische Erwartung, Varianz

Analysen für kategoriale Daten

Fragestellungen und Analysen sowie statistische Tests - Kommen alle Kategorien gleich häufig vor? - Entsprechen Häufigkeiten bestimmten Vorgaben? - Hat ein Anteil einen bestimmten Wert? - Unterscheiden sich Anteile in zwei oder mehr Gruppen? - Sind zwei kategoriale Variablen unabhängig? - Unterscheidet sich das Risiko in zwei Gruppen?

Analysen für metrische Daten

Fragestellungen und Analysen sowie statistische Tests - Wie kann man die Verteilung von metrischen Daten beschreiben? - Ist der Mittelwert der Grundgesamtheit anders als eine bestimmte Vorgabe? - Folgt eine metrische Variable einer bestimmten Verteilung? - Wie stark ist der Zusammenhang? - Welche Form hat der Zusammenhang? - Unterscheiden sich Mittelwerte? - Wie kann man den zeitlichen Verlauf beschreiben?

Dozent/in

Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.

Veröffentlichungen
  • Grundlagen empirische Sozialforschung ISBN 978-3-939701-23-1
  • System und Systematik von Fragebögen ISBN 978-3-939701-26-2
  • Oracle SQL ISBN 978-3-939701-41-5
  • SQL Server 2012: Data Mining und multivariate Verfahren ISBN 978-3-939701-85-9
  • SQL und relationale Datenbanken ISBN 978-3-939701-52-1
Projekte

Als Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.

Forschung

Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.