Inhalt
Statische Maßzahlen der deskriptiven Statistik
Lagemaße: Häufigkeiten mit COUNT, Modus mit STATS_MODE, Mittelwerte mit AVG, MEDIAN - Quantile mit - PERCENTILE_CONT und PERCENTILE_DISC - Streuungsmaße: Spannweite mit MIN und MAX, Standardabweichung mit STDDEV, STDDEV_POP und STDDEV_SAMP, Varianz mit VAR_POP, VAR_SAMP und VARIANCE - Rang und Verteilung mit CUME_DIST, DENSE_RANK, RANK und PERCENT_RANK
Korrelationsanalyse
Kovarianz mit COVAR_POP und COVAR_SAMP - Korrelation mit CORR (Bravais-Pearson) - Rangkorrelation mit CORR_S (Spearmans Rho) und CORR_K (Kendalls Tau)
Regressionssanalyse
Lineare Regression und Methode der kleinsten Quadrate - Geradengleichung ableiten mit REGR_SLOPE und REGR_INTERCEPT - Determinationskoeffizient mit REGR_R2 - Gemeinsamer Schwerpunkt mit REGR_AVGX und REGR_AVGY - Güteanalyse mit REGR_COUNT,
REGR_SXX, REGR_SYY und REGR_SXY - Prognose und Residualanalyse
Kontingenzanalyse
Kontingenzanalyse und Zusammenhang bei kategorialen Variablen - Chi-Quadrat-Test mit CHISQ_OBS und CHISQ_DF - Signifikanz mit CHISQ_SIG - Kontingenzmaße: Phi-Koeffizient mit PHI_COEFFICIENT, Cramers V mit CRAMERS_V, Kontigenzkoeffizient mit CONT_COEFFICIENT und Cohens Kappa mit COHENS_K
Statistisches Testen
Überblick Wahrscheinlichkeitstheorie - Einführung in die Testtheorie - t-Test mit STATS_T_TEST_ONE (eine Stichprobe), STATS_T_TEST_PAIRED (zwei Stichproben), STATS_T_TEST_INDEP (zwei unabhängige Stichproben) und STATS_T_TEST_INDEPU (zwei unabhängige Stichproben mit ungleicher Varianz) - Varianzenvergleich mit STATS_F_TEST - Verteilungstests mit STATS_BINOMIAL_TEST - Mann-Whitney-Test mit STATS_MW_TEST - Kolmogorov-Smirnov-Funktion mit STATS_KS_TEST - Wilcoxon Signed Ranks mit STATS_WSR_TEST
Varianzanalyse (ANOVA)
Varianzanalyse - ANOVA durchführen mit STATS_ONE_WAY_ANOVA: Quadratesumme mit SUM_SQUARES_BETEEN und SUM_SQUARES_WITHIN, mittlere Quadratesummen mit
MEAN_SQUARES_BETWEEN und MEAN_SQUARES_WITHIN, F-Wert mit F_RATIO und Signifikanz mit SIG
Zeitreihenanalyse und Trend
Grundlagen Zeitreihenanalyse: Komponenten, Stationarität, Autokorrelation, Autokovarianz, Periodizität - Glättung: Gleitender Durchschnitt, exponentielles Glätten - Trendberechnungen durchführen mit linearer Regression - Saisonfigur und Residualanalyse
Dozent/in
Unser Statistik- und Data-Mining-Trainer Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken und als Business Intelligence-Berater. Zu seinen Kunden zählen Marktforschungsunternehmen oder Behörden wie der Deutsche Bundesrat sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung.
Veröffentlichungen
- Grundlagen empirische Sozialforschung ISBN 978-3-939701-23-1
- System und Systematik von Fragebögen ISBN 978-3-939701-26-2
- Oracle SQL ISBN 978-3-939701-41-5
- SQL Server 2012: Data Mining und multivariate Verfahren ISBN 978-3-939701-85-9
- SQL und relationale Datenbanken ISBN 978-3-939701-52-1
Projekte
Als Berater und Projektleiter konzipiert Herr Skulschus Business Intelligence-Systeme auf Basis von OLAP und Data Warehouse-Technologien mit MS SQL Server und Oracle mit Berichtskomponenten im Intranet oder MS Excel, statistische Analysen und Data Mining-Modulen. Je nach Aufgabe setzt er R, IBM SPSS oder Minitab ein.
Forschung
Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.