ID 1252816
Klassenraum 2 Tage 9:00-16:30
Webinar 4 Tage 9:00-12:30
Methode Vortrag mit Beispielen und Übungen.
Vorwissen Allgemeine Kenntnisse der Mathematik
Zielgruppe Datenanalysten


  • Data Mining-Ansatz und Philosophie verstehen
  • R und RStudio für Data Mining einsetzen
  • Wichtige R-Pakete für Data Mining kennenlernen
  • Assoziationsanalyse für einfache Mustererkennung nutzen
  • Daten klassifizieren mit Entscheidungsbäumen, Naïve Bayes und Bayes Netzen
  • Daten klassifizieren mit Künstlichen Neuronalen Netzen und Support Vector Machines
  • Cluster-Analyse für Segmentierung von Daten nutzen


Data Mining verstehen
Verstehen Sie die Philosophie von Data Mining und den Data Mining-Kreislauf
Assoziationsanalyse einsetzen
Führen Sie eine Warenkorbanalyse durch und erkennen Sie wesentliche Häufungen
Daten klassifizieren
Nutzen Sie Entscheidungsbäume, Naïve Bayes und Bayes Netze, um Gruppen zu klassifizieren
Daten mit komplexen Modellen segmentieren
Verwenden Sie Künstliche Neuronale Netze und Support Vector Machines, um Gruppen zu trennen
Cluster-Analyse für Segmentierung von Daten nutzen
Erkennen Sie Gemeinsamkeiten und Gruppen in Ihren Daten
R und RStudio für Data Mining verwenden
Nutzen Sie in R typische Data Mining-Pakete


R Data Mining mit R Training

Beschreibung

R bietet für multivariate Analysen und Data Mining eine Vielzahl an Paketen. Nutzen Sie R für Data Mining, um Muster in Daten zu erkennen wie bspw. Gruppen, wichtige Variablen oder Zusammenhänge, die für Klassifikation und Vorhersage genutzt werden können. Dieses Seminar zeigt Ihnen, wie Sie mit RStudio und den gängigen R-Paketen viele Data Mining-Verfahren durchführen können. Es vermittelt Ihnen sowohl die mathematischen Hintergründe der einzelnen Verfahren und zeigt, wie Sie Data Mining praktisch mit R, RStudio und R Data Miner (Rattle) durchführen können.



R Data Mining mit R Training

Services

  • Mittagessen / Catering
  • Hilfe bei Hotel / Anreise
  • Comelio-Zertifikat
  • Flexibel: Bis einen Tag vorher kostenlos stornieren

Übersicht

R Data Mining mit R TrainingData Mining übertrifft einfache Analysetechniken an Wirkungsweise und Ergebnissen und bietet eine Methodik, die auf erweiterten statistischen und algorithmischen Konzepten des maschinellen Lernens beruht. Es unterstützt die Entwicklung und Gewinnung von wertvollem Unternehmenswissen anhand komplexer Analyseverfahren. Dieses Seminar macht Sie mit den Konzepten von Data Mining in R mit RStudio vertraut und hilft Ihnen bei der Entscheidung und Bewertung in Projekten, die Data Mining einführen helfen. Das Seminar zeigt Ihnen mit Theorie und Beispielen, welche typischen Analyseverfahren in R zur Verfügung stehen und wie gängige Algorithmen funktionieren. Es sind grundlegende Kenntnisse der Mathematik und Statistik notwendig, die bei Bedarf allerdings auch an den entsprechenden Stellen im Seminar noch einmal wiederholt werden können.

Termine

  • 2022-May-19 - May-20
  • 2022-Jul-28 - Jul-29

1150 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-May-26 - May-27
  • 2022-Aug-04 - Aug-05

1200 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-May-19 - May-20
  • 2022-Jul-28 - Jul-29

1200 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-Jun-02 - Jun-03
  • 2022-Aug-11 - Aug-12

1200 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-May-19 - May-20
  • 2022-Jul-28 - Jul-29

1200 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-Jun-02 - Jun-03
  • 2022-Aug-11 - Aug-12

1200 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-Jun-02 - Jun-03
  • 2022-Aug-11 - Aug-12

1180 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-Jun-02 - Jun-03
  • 2022-Aug-11 - Aug-12

1250 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2022-May-30 - Jun-02
  • 2022-Aug-08 - Aug-11

650 EUR zzgl. MwSt.

Standort | Anmeldung


Inhalt

R Data Mining mit R Seminar
Data Mining-Grundlagen

Statistik, multivariate Statistik und Data Mining – Data Mining-Kreislauf - Daten-Vorverarbeitung: Beschreibende Datenaggregation, Datenbereinigung, Datenintegration und –transformation – Datenreduktion – Diskretisierung und Konzept-Hierarchien – Data Mining und Business Intelligence: Datenbanken, Data Warehouses und OLAP als Basis für Data Mining

Data Mining mit der Assoziationsanalyse

Suchen von häufigen Kombinationen (Frequent Itemset Mining) – Apriori-Algorithmus - Assoziationsregeln und Assoziationsanalyse - Warenkorbanalyse

Data Mining mit Entscheidungsbäumen

Ableitung von Entscheidungsbäumen – Auswahl von Attributen – Beschneidung von Bäumen – Ableitung von Regeln - Gütemaße und Vergleich von Modellen

Data Mining mit Wahrscheinlichkeitstheorie

Wahrscheinlichkeitstheorie und Bayes Theorem –Naïve Bayes-Algorithmus – Bayes Netze

Fortgeschrittene Data Mining-Verfahren für Klassifikation

Künstliche neuronale Netze und der Backpropagation-Algorithmus - Support Vector Machines für linear und nicht-linear trennbare Daten – Klassifikation mit Assoziationsanalyse – Lazy und Eager Learners

Cluster-Analyse

Einführung in die Cluster Analyse – Ähnlichkeits- und Distanzmessung - Varianten und grundlegende Techniken – Partitionierende Methoden: k-Means-Verfahren - Hierarchische Methoden: agglomerative und divisive Verfahren – Weitere Verfahren: Dichte- und Grid-basierte Methoden

Dozent/in

R Data Mining mit R Trainer

Unser Statistik- und Data-Mining-Trainer Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken und als Business Intelligence-Berater. Zu seinen Kunden zählen Marktforschungsunternehmen oder Behörden wie der Deutsche Bundesrat sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung.

Veröffentlichungen
  • Grundlagen empirische Sozialforschung ISBN 978-3-939701-23-1
  • System und Systematik von Fragebögen ISBN 978-3-939701-26-2
  • Oracle SQL ISBN 978-3-939701-41-5
  • SQL Server 2012: Data Mining und multivariate Verfahren ISBN 978-3-939701-85-9
  • SQL und relationale Datenbanken ISBN 978-3-939701-52-1
Projekte

Als Berater und Projektleiter konzipiert Herr Skulschus Business Intelligence-Systeme auf Basis von OLAP und Data Warehouse-Technologien mit MS SQL Server und Oracle mit Berichtskomponenten im Intranet oder MS Excel, statistische Analysen und Data Mining-Modulen. Je nach Aufgabe setzt er R, IBM SPSS oder Minitab ein.

Forschung

Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.

R Data Mining mit R Trainer