Multivariate Datenanalyse mit R, Basis - Seminar / Kurs von Dr. Haug Leuschner

Die 3tägige Basis-Schulung "Multivariate Datenanalyse mit R" behandelt strukturprüfende Verfahren zur Analyse des Zusammenhangs zwischen mehreren Variablen unter Anwendung der statistischen Programmiersprache R.

Inhalte

Die Multivariate Datenanalyse untersucht den Einfluss von Zusammenhangsstrukturen wie z.B. den Einfluss von Position, Einkommen, Verantwortung und Mitarbeiterzufriedenheit auf die Zahl der Krankentage. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird und die Gegenstand des Seminars Grundlagen der Statistik mit R sind. Multivariate Verfahren wollen die Zahl der Variablen, Dimensionen oder Faktoren reduzieren, im Ergebnis aber die Gesamtheit der enthaltenen Information berücksichtigen. Dazu wird die (Zusammenhangs-)Struktur der Daten analysiert. Entweder gibt man im Rahmen der induktiven Statistik eine Struktur vor und prüft mit Hilfe strukturprüfender Verfahren, ob die Daten mit der vorgegebenen Struktur zusammenpassen, oder man versucht im Rahmen der explorativen Statistik, die Struktur zu entdecken und aus den Daten zu extrahieren. Beide Verfahrensarten ergänzen sich häufig: So werden z.B. mit Hilfe der Clusteranalyse Kundendaten verwendet, um verschiedene, klar voneinander abgrenzbare Kundengruppen zu bestimmen. Mittels einer nachgeschalteten Diskriminanzanalyse können die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich klar voneinander unterscheiden lassen. Mit den gewonnenen Erkenntnissen kann bei neuen Fällen die Gruppenzugehörigkeit prognostiziert werden (z.B. ob der Interessent zur Gruppe der Stammkunden gehört).Im dreitägigen Basistraining werden die regressionsanalytischen Verfahren behandelt. Dazu gehören die multiple Regressionsanalyse, die logistische Regression und die Zeitreihenanalyse, die Zeitreihen mittels verschiedener regressionsanalytischer Verfahren (Zeitregression, exponentielle Prognosemodelle, ARIMA-Modelle, LOESS-Dekomposition) in mehrere Komponenten zerlegt und Prognosen für zukünftige Entwicklungen erlaubt (prädiktive Analyse/Forecasting).

Voraussetzungen: die Inhalte des Seminars Grundlagen der Statistik mit R; Praxiserfahrungen mit R/RStudio

Übungen: Es wird Wert auf den Anwendungsbezug gelegt, die Praxisbeispiele und Übungsaufgaben erfolgen mit dem Statistikprogramm R unter der Oberfläche RStudio.

Inhalte:

  • Multiple Regressionsanalyse Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); automatisierte Verfahren zur Auswahl von Prognosevariablen und der Ermittlung des am besten an die Daten angepassten Modells; Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit, Linearität, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Behandlung von Ausreißern, Extremwerten und einflussreichen Beobachtungen)
  • Logistische Regression Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
  • Zeitreihenanalyse Zeitregression mit linearen und nichtlinearen Trend-, Konjunktur- und Saison-Komponenten und unter Berücksichtigung von Strukturbrüchen; Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten; exponentielle Prognosemodelle und ARIMA-Modelle (prediktive Analyse); Erstellung von kurz- und langfristigen Prognosen; grafische Darstellung von Zeitreihen mit Prognose und Prognoseintervallen

Lernziele

fortgeschrittene Funktionen von R kennenlernen, Daten von Studien bzw. betrieblichen Prozessen erheben und mit Hilfe von multivariaten Verfahren auswerten können, Ergebnisse von multivariaten Datenanalysen grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Zielgruppen

fortgeschrittene Anwender, Fachkräfte und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Controlling, Qualitätskontrolle) und der psychologischen, klinischen und pharmazeutischen Forschung: Vorkenntnisse in R sind erforderlich (bitte Zertifikate vorlegen), Praxiserfahrungen mit R/RStudio sind angeraten

Termine und Orte

Datum Uhrzeit Dauer Preis
Frankfurt am Main, DE
24.06.2019 - 26.06.2019 09:00 - 17:00 Uhr 24 h Jetzt buchen ›
Hamburg, DE
16.12.2019 - 18.12.2019 09:00 - 17:00 Uhr 24 h Jetzt buchen ›

SG-Seminar-Nr.: 1697586

Anbieter-Seminar-Nr.: MDR-B

Termine

  • 24.06.2019 - 26.06.2019

    Frankfurt am Main, DE

  • 16.12.2019 - 18.12.2019

    Hamburg, DE

Preise inkl. MwSt. Es können Gebühren anfallen. Für eine exakte Preisauskunft wählen Sie bitte einen Termin aus.

Jetzt buchen ›
Seminar merken ›

Sie buchen immer automatisch den besten Preis für jeden Termin. Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Über Semigator mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Uhrzeit Dauer Preis
Frankfurt am Main, DE
24.06.2019 - 26.06.2019 09:00 - 17:00 Uhr 24 h Jetzt buchen ›
Hamburg, DE
16.12.2019 - 18.12.2019 09:00 - 17:00 Uhr 24 h Jetzt buchen ›