Statistik mit R

Details

ID	1252613
Dauer	3.0 Tage
Methoden	Vortrag mit Beispielen und Übungen.
Vorwissen	Allgemeine Kenntnisse der Mathematik
Zielgruppe	Datenanalysten

Ziele

Datensätze beschreiben

Lernen Sie, mit Lage- und Streuungsmaßen Datensätze zu beschreiben

Zusammenhängen aufdecken

Weisen Sie Zusammenhänge zwischen Datenreihen nach

Statistische Modelle entwickeln

Verwenden Sie Regression, um Daten in Modellen zu erklären

Rechnen mit Wahrscheinlichkeiten

Setzen Sie induktive Statistik für Wahrscheinlichkeiten ein

Hypothesen testen und nachweisen

Sehen Sie, wie Sie Hypothesen über die Grundgesamtheit prüfen

Wahrscheinlichkeitsverteilungen kennenlernen

Lernen Sie gängige Verteilungen kennen und nutzen

Schlussfolgerungen über die Grundgesamtheit treffen

Leiten Sie aus der Stichprobe Eigenschaften über die Grundgesamtheit ab

Übersicht

R ist eine freie und damit kostenlose Programmiersprache für statistische Analyse und statistische Grafiken. R gilt zunehmend als die statistische Standardsprache sowohl im kommerziellen als auch im wissenschaftlichen Bereich. Der Funktionsumfang von R kann durch eine Vielzahl von Paketen erweitert und an spezifische statistische Problemstellungen angepasst werden. Dieses Seminar zeigt Ihnen zunächst, wie sie mit R grundsätzlich arbeiten können und Daten lesen und schreiben sowie Grafiken erzeugen können. Im zweiten Teil beschäftigen Sie sich mit deskriptiver Statistik, d.h. statistischen Lage- und Streuungsmaßen für metrische Daten und Korrelation sowie Kennzahlen für kategoriale Daten. Im dritten Teil lernen Sie die Theorie der Wahrscheinlichkeit sowie die gängigen statistischen Standard-Verteilungen kennen. Danach lernen Sie, typische Fragestellungen für kategoriale und metrische Daten mit Hilfe der induktiven Statistik zu beantworten und so von der Stichprobe auf die Grundgesamtheit zu schließen.

Termine

OPEN

INHOUSE

Zurzeit stehen keine offenen Termine zur Verfügung. Nutzen Sie alternativ die Inhouse‑Option.

Lernen Sie anhand maßgeschneiderter Beispiele und Inhalte – passgenau für Ihre Anforderungen.

Ihre Vorteile im Überblick

Flexibles Wunschdatum
Maßgeschneiderte Inhalte
Intensiver Austausch
Hoher Praxisbezug

Comelio Medien

Noch auf der Suche nach weiterführender Literatur? Entdecken Sie passende Fachbücher in unserem Katalog.

Zum Bücherkatalog

Themen

Daten in R beschreiben, darstellen und zusammenfassen
Statistische Modelle für Prognosen und Erklärungen mit der linearen Regression in R aufbauen
Wahrscheinlichkeitstheorie verstehen und wichtige Verteilungen kennenlernen
Eigenschaften von Daten prüfen und mit Hypothesentests bewerten
Analysen für kategoriale Daten in R durchführen
Daten mit R und RStudio bearbeiten

Beschreibung

Nutzen Sie R und RStudio für die deskriptive und induktive Datenanalyse und beschreiben Sie Daten, weisen Sie Eigenschaften nach und prüfen Sie Hypothesen.

Services

Mittagessen / Catering
Hilfe bei Hotel / Anreise
Comelio-Zertifikat
Flexibel: Bis einen Tag vorher kostenlos stornieren

Inhalt

Einführung in R

Aufrufen und Beenden von R - RStudio als Analyseumgebung - Einsatz von RCommander - R und R-Skripte: Daten (Variablen, Vektoren, Matrizen, Tabellen und Data Frames) definieren, filtern und transformieren - Arbeiten mit MS Excel und Text-Dateien für Import/Export - Grafiken und Diagramme für eine und mehrere Variablen erstellen - Mathematische Funktionen - Nutzen von RCommander

Deskriptive Statistik: Eindimensionale Häufigkeitsverteilungen

Häufigkeitsverteilungen und grafische Darstellung bei verschiedenen Skalen - Maßzahlen der Häufigkeit: Mittelwerte (Modus, Zentralwert, Quantile, Arithmetisches / geometrisches / harmonisches Mittel) - Streuungsmaße: Spannweite, Quartilsabstand, Mittlere absolute Abweichung, empirische Standardabweichung, Variationskoeffizient - Formparameter: Schiefemaße, Wölbungsmaße

Induktive Statistik: Wahrscheinlichkeit

Grundlagen: Zufallsexperiment, Ergebnismenge und Ereignis, Zusammengesetzte Ereignisse, Absolute und relative Häufigkeiten - Wahrscheinlichkeitsbegriffe: Klassischer, statistischer und subjektiver Wahrscheinlichkeitsbegriff - Rechnen mit Wahrscheinlichkeiten: Axiome und ihre Folgerungen, Bedingte Wahrscheinlichkeit, Multiplikationssatz, Stochastische Unabhängigkeit, Satz der totalen Wahrscheinlichkeit, Bayessches Theorem

Induktive Statistik: Wahrscheinlichkeitsverteilungen

Zufallsvariablen - Diskrete Verteilungen: Binomialverteilung, Poissonverteilung, Hypergeometrische Verteilung, Geometrische Verteilung - Stetige Verteilungen: Gleichverteilung, Exponentialverteilung, Normalverteilung - Maßzahlen: Erwartungswert, Mathematische Erwartung, Varianz - Einsatz verschiedenen R-Funktionen für Berechnung und grafischer Ausgabe gängiger Verteilungen

Induktive Statistik: Hypothesentests

Einführung in statistisches Testen: Hypothesen, Fehler I. und II. Art, Signifikanz, Power eines Tets - Hypothesentests und Aussagen über den Mittelwert, die Streuung und den Anteilswert - Berechnung von Konfindenzintervallen für statistische Maßzahlen - Tests für eine und zwei Stichproben - Tests auf Normalverteilung - Tests in R und mit RCommander durchführen

Analysen für metrische Daten

Streudiagramm - Korrelation - Lineare Einfachregression - Modelle mit einer und mehreren Variablen in R erstellen - Modellgüte bewerten - Visualisieren der Ergebnisse

Analysen für kategoriale Daten

Faktoren in R definieren - Kontingenztafeln und Kreuztabellierung in R für Zahldaten - Randhäufigkeiten und Prozente - Kontingenzanalyse und der Chi-Quadrat-Test - Maßzahlen für den Zusammenhang - Varianzanalyse (ANOVA)

Dozent/in

Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.

Veröffentlichungen

Grundlagen empirische Sozialforschung (Comelio Medien)
978-3-939701-23-1
System und Systematik von Fragebögen (Comelio Medien)
978-3-939701-26-2
Oracle SQL (Comelio Medien)
978-3-939701-41-5
SQL Server 2012: Data Mining und multivariate Verfahren (Comelio Medien)
978-3-939701-85-9
SQL und relationale Datenbanken (Comelio Medien)
978-3-939701-52-1

Projekte

nEr leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.

Forschung

nAls Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.