Multivariate Datenanalyse mit R, Komplett - Seminar / Kurs von Dr. Haug Leuschner

Die 5tägige Komplett-Schulung "Multivariate Datenanalyse mit R" behandelt strukturprüfende und strukturentdeckende Verfahren zur Analyse des Zusammenhangs zwischen mehreren Variablen unter Anwendung der statistischen Programmiersprache R.

Inhalte

Die Multivariate Datenanalyse untersucht den Einfluss von Zusammenhangsstrukturen zwischen den Variablen wie z.B. den Einfluss von Position, Einkommen, Verantwortung und Mitarbeiterzufriedenheit auf die Zahl der Krankentage. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird. Multivariate Verfahren wollen die in einem Datensatz enthaltene Zahl der Variablen, Dimensionen oder Faktoren reduzieren, im Ergebnis aber die Gesamtheit der enthaltenen Information berücksichtigen. Entweder gibt man im Rahmen der induktiven Statistik eine Struktur vor und prüft mit Hilfe strukturprüfender Verfahren, ob die Daten mit der vorgegebenen Struktur zusammenpassen, oder man versucht im Rahmen der explorativen Statistik, die Struktur zu entdecken und aus den Daten zu extrahieren. Beide Verfahrensarten ergänzen sich häufig: So werden z.B. mit Hilfe der Clusteranalyse Kundendaten verwendet, um verschiedene, klar voneinander abgrenzbare Kundengruppen zu bestimmen. Mittels einer Diskriminanzanalyse können die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich klar voneinander unterscheiden. Mit den gewonnenen Erkenntnissen kann bei neuen Fällen die Gruppenzugehörigkeit prognostiziert werden (z.B. ob der Interessent zur Gruppe der Stammkunden gehört).Im dreitägigen Basistraining werden regressionsanalytischen Verfahren behandelt. Dazu gehören die multiple Regression, die logistische Regression und die Zeitreihenanalyse, die Zeitreihen mittels regressionsanalytischer Verfahren (Zeitregression, exponentielle Prognosemodelle, ARIMA-Modelle, LOESS-Dekomposition) in mehrere Komponenten zerlegt und Prognosen für zukünftige Entwicklungen erlaubt (prädiktive Analyse/Forecasting).Im zweitägigen Aufbautraining werden strukturentdeckende Verfahren behandelt. Dazu gehören die Clusteranalyse und die explorative Faktorenanalyse. Ergänzend werden die Diskriminanz- und Reliabilitätsanalyse vermittelt.

Voraussetzungen: die Inhalte des Seminars Grundlagen der Statistik mit R und Praxiserfahrungen mit R/RStudio

Übungen: Es wird Wert auf den Anwendungsbezug gelegt, die Praxisbeispiele und Übungsaufgaben erfolgen mit dem Statistikprogramm R unter der Oberfläche RStudio.

Inhalte:Basis-Training:

  • Multiple Regressionsanalyse Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); automatisierte Verfahren zur Auswahl von Prognosevariablen und der Ermittlung des am besten an die Daten angepassten Modells; Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit, Linearität, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Behandlung von Ausreißern, Extremwerten und einflussreichen Beobachtungen)
  • Logistische Regression Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
  • Zeitreihenanalyse Zeitregression mit linearen und nichtlinearen Trend-, Konjunktur- und Saison-Komponenten und unter Berücksichtigung von Strukturbrüchen; Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten; exponentielle Prognosemodelle und ARIMA-Modelle (prediktive Analyse); Erstellung von kurz- und langfristigen Prognosen; grafische Darstellung von Zeitreihen mit Prognose und Prognoseintervallen

Aufbau-Training:

  • Clusteranalyse Hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage, Ward, Bestimmung der optimalen Clusterzahl), k-Means-Clusteranalyse
  • Diskriminanzanalyse Schätzung der Diskriminanzfunktion, Prüfung der Eignung von Merkmalsvariablen und der Modellgüte, Klassifikation von neuen Fällen
  • Explorative Faktorenanalyse Variablenauswahl, Bestimmung der Anzahl der Faktoren, Extraktion und Rotation der Faktoren, Faktorinterpretation, Faktorwerte
  • Reliabilitätsanalyse Prüfung des Indikatorsets eines Faktors auf Eindimensionalität; Reliabilitätsprüfung auf Indikatorebene (Indikatorreliabilität): Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation; Prüfung auf Konstruktebene (Faktorreliabilität): Cronbachs Alpha, Inter-Item-Korrelationen, Einheitsstruktur

Lernziele

fortgeschrittene Funktionen von R kennenlernen, Daten von Studien bzw. betrieblichen Prozessen erheben und mit Hilfe von multivariaten Verfahren auswerten können, Ergebnisse von multivariaten Datenanalysen grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Zielgruppen

fortgeschrittene Anwender, Fachkräfte und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Controlling, Qualitätskontrolle) und der psychologischen, klinischen und pharmazeutischen Forschung: Vorkenntnisse in R sind erforderlich (bitte Zertifikate vorlegen), Praxiserfahrungen mit R/RStudio sind angeraten

Termine und Orte

Datum Uhrzeit Dauer Preis
Hamburg, DE
16.12.2019 - 20.12.2019 09:00 - 17:00 Uhr 40 h Jetzt buchen ›

SG-Seminar-Nr.: 1697590

Anbieter-Seminar-Nr.: MDR-K

Termine

  • 16.12.2019 - 20.12.2019

    Hamburg, DE

Preise inkl. MwSt. Es können Gebühren anfallen. Für eine exakte Preisauskunft wählen Sie bitte einen Termin aus.

Jetzt buchen ›
Seminar merken ›

Sie buchen immer automatisch den besten Preis für jeden Termin. Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Über Semigator mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Uhrzeit Dauer Preis
Hamburg, DE
16.12.2019 - 20.12.2019 09:00 - 17:00 Uhr 40 h Jetzt buchen ›