Details

ID 1252623
Klassenraum 3 Tage
Webinar 5 Tage
Methode Vortrag mit Beispielen und Übungen.
Vorwissen Grundlagen der Statistik
Zielgruppe Datenanalysten



Nutzen Sie fortgeschrittene statistische Techniken in Python, um statistische Modelle zu entwickeln, Zusammenhänge aufzudecken und wichtige Variablen zu finden.

Services:

  • Mittagessen / Catering
  • Hilfe bei Hotel / Anreise
  • Comelio-Zertifikat
  • Flexibel: Bis 10 Tage vorher kostenlos stornieren

Übersicht

Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer Variablen zugleich und damit ihre Abhängigkeitsstruktur. Multivariate Verfahren lassen sich gliedern in "Strukturprüfende Verfahren" und "Strukturentdeckende Verfahren". Dieses Python-Seminar behandelt 8 wichtige Verfahren der multivariaten Analysemethoden. Dies sind Cluster-, Diskriminanz- und Explorative Faktorenanalyse, Kreuztabellierung und Kontingenzanalyse, Logistische Regression, Regressionsanalyse, Varianzanalyse und Zeitreihenanalyse. Die Themen werden anhand von Vorträgen eingeführt und dann anhand von praktischen Übungen in Python durchgeführt. Teilnehmer/innen sollen nach dem Seminar in der Lage sein, die genannten Verfahren zu verstehen und bewerten zu können, um sie dann mit Erfolg auch für die konkrete Datenanalyse mit Python-Programmierung einzusetzen.

Termine

  • 2020-Oct-19 - Oct-23
  • 2020-Dec-28 - Jan-01
  • 2021-Mar-08 - Mar-12
  • 2021-May-17 - May-21

1450 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-13
  • 2021-Jan-18 - Jan-22
  • 2021-Mar-29 - Apr-02
  • 2021-Jun-07 - Jun-11

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-13
  • 2021-Jan-18 - Jan-22
  • 2021-Mar-29 - Apr-02
  • 2021-Jun-07 - Jun-11

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-13
  • 2021-Jan-18 - Jan-22
  • 2021-Mar-29 - Apr-02
  • 2021-Jun-07 - Jun-11

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-02 - Nov-06
  • 2021-Jan-11 - Jan-15
  • 2021-Mar-22 - Mar-26
  • 2021-May-31 - Jun-04

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-02 - Nov-06
  • 2021-Jan-11 - Jan-15
  • 2021-Mar-22 - Mar-26
  • 2021-May-31 - Jun-04

1500 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-13
  • 2021-Jan-18 - Jan-22
  • 2021-Mar-29 - Apr-02
  • 2021-Jun-07 - Jun-11

1480 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-09 - Nov-13
  • 2021-Jan-18 - Jan-22
  • 2021-Mar-29 - Apr-02
  • 2021-Jun-07 - Jun-11

1550 EUR zzgl. MwSt.

Standort | Anmeldung

  • 2020-Nov-06 - Nov-05
  • 2021-Jan-15 - Jan-14
  • 2021-Mar-26 - Mar-25
  • 2021-Jun-04 - Jun-03

950 EUR zzgl. MwSt.

Standort | Anmeldung


Inhalt

Multiple Regressionsanalyse

Wie stark ist der als linear unterstellte Zusammenhang zwischen metrisch-skalierten Variablen? – Modellformulierung – Schätzung der Regressionsfunktion – Prüfung der Regressionsfunktion – Prüfung der Regressionskoeffizienten – Prüfung der Modellprämissen

Zeitreihenanalyse

Wie stark ist der Zusammenhang zwischen einer metrisch-skalierten abhängigen Variablen und metrisch-skalierten Zeitreihendaten? – Visualisierung der Zeitreihe – Formulierung des Modells – Schätzung des Modells – Erstellung von Prognosen – Prüfung der Prognosegüte

Varianzanalyse (ANOVA)

Wie gut kann eine metrisch-skalierte abhängige Variable durch eine nominal skalierte unabhängige Variable erklärt werden? – Problemformulierung – Analyse der Abweichungsquadrate – Prüfung der statistischen Unabhängigkeit

Diskriminanzanalyse

Welche Variablen können gegebene Objektgruppen signifikant voneinander unterscheiden? – Definition der Gruppen – Formulierung, Schätzung und Prüfung der Diskriminanzfunktion – Prüfung der Merkmalsvariablen – Klassifikation neuer Elemente

Logistische Regression

Mit welcher Wahrscheinlichkeit können Objekte einer bestimmten Gruppe zugeordnet werden? – Modellformulierung – Schätzung der logistischen Regressionsfunktion – Interpretation der Regressionskoeffizienten – Prüfung des Gesamtmodells – Prüfung der Merkmalsvariablen

Kontingenzanalyse (Kreuztabellierung)

Besteht ein statistisch signifikanter Zusammenhang zwischen zwei nominal-skalierten Variablen? – Erstellung der Kreuztabelle – Ergebnisinterpretation – Prüfung der Zusammenhänge

Explorative Faktorenanalyse

Wie können metrisch-skalierte Variablen zu hypothetischen Größen (Faktoren) zusammengefasst werden? – Variablenauswahl und Korrelationsmatrix – Extraktion der Faktoren – Bestimmung der Kommunalitäten – Zahl der Faktoren – Faktorinterpretation – Bestimmung der Faktorenwerte

Clusteranalyse

Wie können Objekte, die durch verschiedene Merkmale beschrieben sind, zu homogenen Gruppen zusammenfasst werden? – Bestimmung der Ähnlichkeiten – Auswahl des Fusionsalgorithmus – Bestimmung der Clusteranzahl

Dozent/in

Unser Python-Trainer Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Berater und auch Fachbuch-Autor zum Thema Datenbanken, statistische Datenanalyse, Data Mining und Python. Er unterrichtet deskriptive und induktive Statistik, multivariate Verfahren und Data Mining für die Bereiche Controlling und Marketing bzw. Marktforschung.

Veröffentlichungen
  • Grundlagen empirische Sozialforschung ISBN 978-3-939701-23-1
  • System und Systematik von Fragebögen ISBN 978-3-939701-26-2
Projekte

Im Bereich statistischer Datenanalyse führt Herr Skulschus als Berater und Projektleiter auch Projekte durch, bei denen Python zum Einsatz kommt oder mit individueller Software-Entwicklung in Java und .NET auf Datenbank-Basis Analyse- und Reporting-Lösungen entstehen.

Forschung

Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.