Statistik mit R

Details

ID 1252613
Dauer 3.0 Tage
Methoden Vortrag mit Beispielen und Übungen.
Vorwissen Allgemeine Kenntnisse der Mathematik
Zielgruppe Datenanalysten

Ziele

Datensätze beschreiben
Lernen Sie, mit Lage- und Streuungsmaßen Datensätze zu beschreiben
Zusammenhängen aufdecken
Weisen Sie Zusammenhänge zwischen Datenreihen nach
Statistische Modelle entwickeln
Verwenden Sie Regression, um Daten in Modellen zu erklären
Rechnen mit Wahrscheinlichkeiten
Setzen Sie induktive Statistik für Wahrscheinlichkeiten ein
Hypothesen testen und nachweisen
Sehen Sie, wie Sie Hypothesen über die Grundgesamtheit prüfen
Wahrscheinlichkeitsverteilungen kennenlernen
Lernen Sie gängige Verteilungen kennen und nutzen
Schlussfolgerungen über die Grundgesamtheit treffen
Leiten Sie aus der Stichprobe Eigenschaften über die Grundgesamtheit ab

Übersicht

R ist eine freie und damit kostenlose Programmiersprache für statistische Analyse und statistische Grafiken. R gilt zunehmend als die statistische Standardsprache sowohl im kommerziellen als auch im wissenschaftlichen Bereich. Der Funktionsumfang von R kann durch eine Vielzahl von Paketen erweitert und an spezifische statistische Problemstellungen angepasst werden. Dieses Seminar zeigt Ihnen zunächst, wie sie mit R grundsätzlich arbeiten können und Daten lesen und schreiben sowie Grafiken erzeugen können. Im zweiten Teil beschäftigen Sie sich mit deskriptiver Statistik, d.h. statistischen Lage- und Streuungsmaßen für metrische Daten und Korrelation sowie Kennzahlen für kategoriale Daten. Im dritten Teil lernen Sie die Theorie der Wahrscheinlichkeit sowie die gängigen statistischen Standard-Verteilungen kennen. Danach lernen Sie, typische Fragestellungen für kategoriale und metrische Daten mit Hilfe der induktiven Statistik zu beantworten und so von der Stichprobe auf die Grundgesamtheit zu schließen.

Termine

Wir überarbeiten gerade unsere Webseite und die Seminare. Neue Termine gibt es erst ab 2025. Wir bieten dieses Seminar weiterhin als Inhouse-Seminar für Sie und Ihr Team an.

Comelio Medien

Noch auf der Suche nach weiterführender Literatur? Entdecken Sie passende Fachbücher in unserem Katalog.

Themen

  • Daten in R beschreiben, darstellen und zusammenfassen
  • Statistische Modelle für Prognosen und Erklärungen mit der linearen Regression in R aufbauen
  • Wahrscheinlichkeitstheorie verstehen und wichtige Verteilungen kennenlernen
  • Eigenschaften von Daten prüfen und mit Hypothesentests bewerten
  • Analysen für kategoriale Daten in R durchführen
  • Daten mit R und RStudio bearbeiten

Beschreibung

Nutzen Sie R und RStudio für die deskriptive und induktive Datenanalyse und beschreiben Sie Daten, weisen Sie Eigenschaften nach und prüfen Sie Hypothesen.

Services

  • Mittagessen / Catering
  • Hilfe bei Hotel / Anreise
  • Comelio-Zertifikat
  • Flexibel: Bis einen Tag vorher kostenlos stornieren
Service-Kaffeekanne

Inhalt

Einführung in R
Aufrufen und Beenden von R - RStudio als Analyseumgebung - Einsatz von RCommander - R und R-Skripte: Daten (Variablen, Vektoren, Matrizen, Tabellen und Data Frames) definieren, filtern und transformieren - Arbeiten mit MS Excel und Text-Dateien für Import/Export - Grafiken und Diagramme für eine und mehrere Variablen erstellen - Mathematische Funktionen - Nutzen von RCommander
Deskriptive Statistik: Eindimensionale Häufigkeitsverteilungen
Häufigkeitsverteilungen und grafische Darstellung bei verschiedenen Skalen - Maßzahlen der Häufigkeit: Mittelwerte (Modus, Zentralwert, Quantile, Arithmetisches / geometrisches / harmonisches Mittel) - Streuungsmaße: Spannweite, Quartilsabstand, Mittlere absolute Abweichung, empirische Standardabweichung, Variationskoeffizient - Formparameter: Schiefemaße, Wölbungsmaße
Induktive Statistik: Wahrscheinlichkeit
Grundlagen: Zufallsexperiment, Ergebnismenge und Ereignis, Zusammengesetzte Ereignisse, Absolute und relative Häufigkeiten - Wahrscheinlichkeitsbegriffe: Klassischer, statistischer und subjektiver Wahrscheinlichkeitsbegriff - Rechnen mit Wahrscheinlichkeiten: Axiome und ihre Folgerungen, Bedingte Wahrscheinlichkeit, Multiplikationssatz, Stochastische Unabhängigkeit, Satz der totalen Wahrscheinlichkeit, Bayessches Theorem
Induktive Statistik: Wahrscheinlichkeitsverteilungen
Zufallsvariablen - Diskrete Verteilungen: Binomialverteilung, Poissonverteilung, Hypergeometrische Verteilung, Geometrische Verteilung - Stetige Verteilungen: Gleichverteilung, Exponentialverteilung, Normalverteilung - Maßzahlen: Erwartungswert, Mathematische Erwartung, Varianz - Einsatz verschiedenen R-Funktionen für Berechnung und grafischer Ausgabe gängiger Verteilungen
Induktive Statistik: Hypothesentests
Einführung in statistisches Testen: Hypothesen, Fehler I. und II. Art, Signifikanz, Power eines Tets - Hypothesentests und Aussagen über den Mittelwert, die Streuung und den Anteilswert - Berechnung von Konfindenzintervallen für statistische Maßzahlen - Tests für eine und zwei Stichproben - Tests auf Normalverteilung - Tests in R und mit RCommander durchführen
Analysen für metrische Daten
Streudiagramm - Korrelation - Lineare Einfachregression - Modelle mit einer und mehreren Variablen in R erstellen - Modellgüte bewerten - Visualisieren der Ergebnisse
Analysen für kategoriale Daten
Faktoren in R definieren - Kontingenztafeln und Kreuztabellierung in R für Zahldaten - Randhäufigkeiten und Prozente - Kontingenzanalyse und der Chi-Quadrat-Test - Maßzahlen für den Zusammenhang - Varianzanalyse (ANOVA)

Dozent/in

Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.

Veröffentlichungen

  • Grundlagen empirische Sozialforschung (Comelio Medien)
    978-3-939701-23-1
  • System und Systematik von Fragebögen (Comelio Medien)
    978-3-939701-26-2
  • Oracle SQL (Comelio Medien)
    978-3-939701-41-5
  • SQL Server 2012: Data Mining und multivariate Verfahren (Comelio Medien)
    978-3-939701-85-9
  • SQL und relationale Datenbanken (Comelio Medien)
    978-3-939701-52-1

Projekte

nEr leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.

Forschung

nAls Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.