Multivariate Datenanalyse mit R, Aufbau - Seminar / Kurs von DHL Data Science Seminare GmbH

Der Kurs Multivariate Datenanalyse mit R führt in die multivariate Statistik ein. Der Aufbaukurs behandelt die strukturenentdeckenden Verfahren: Clusteranalyse, Faktorenanalyse, Zeitreihenanalyse, Diskriminanzanalyse

Inhalte

Die Anwendung der multivariaten Verfahren mit der statistischen Programmiersprache R unter der Entwicklungsoberfläche RStudio wird auf unseren Schulungslaptops mit vielen Beispielen und Übungsaufgaben trainiert und vertieft. Das Ziel der R Schulung ist es, multivariate Verfahren mit R unter RStudio anwenden zu können.Es wird Wert auf den Anwendungsbezug gelegt, die Praxisbeispiele und Übungsaufgaben erfolgen in der R Schulung auf unseren Schulungslaptops mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.

Was sind multivariate Verfahren?

Die Multivariate Datenanalyse untersucht den Einfluss von mehreren statistischen Variablen zugleich. Zusammenhangsstrukturen zwischen den Variablen können nur mit den multivariaten Verfahren der multivariaten Statistik erkannt werden. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird. Die univariaten Verfahren werden in dem R-Kurs Grundlagen der Statistik mit R vermittelt.

Multivariate Verfahren wollen im Wesentlichen die in einem Datensatz enthaltene Zahl der Variablen reduzieren, im Ergebnis aber die Gesamtheit der enthaltenen Information berücksichtigen. Dazu wird die Struktur der Daten analysiert. Entweder gibt man im Rahmen der induktiven Statistik eine Struktur vor und prüft mit Hilfe strukturprüfender Verfahren, ob die Daten mit der vorgegebenen Struktur zusammenpassen, oder man versucht im Rahmen der explorativen Statistik, die Struktur zu entdecken und aus den Daten zu extrahieren.

Beide Verfahrensarten der multivariaten Statistik ergänzen sich häufig. So werden beispielsweise mit Hilfe der Clusteranalyse verschiedene, voneinander abgrenzbare Kundengruppen bestimmt. Mittels einer nachgeschalteten Diskriminanzanalyse können dann die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich voneinander unterscheiden lassen. Mit den gewonnenen Erkenntnissen kann bei neuen Fällen die Gruppenzugehörigkeit prognostiziert werden. Oder eine Vielzahl von zu analysierenden Variablen werden zunächst mit Hilfe einer Faktorenanalyse auf wenige Faktoren reduziert. Anschließend werden die auf diese Weise ermittelten Faktoren mit Regressions-, Varianz- oder Zeitreihenanalysen untersucht.

Multivariate Verfahren werden erfolgreich in den verschiedensten Feldern eingesetzt wie beispielsweise in den betriebswirtschaftlichen Anwendungsbereichen (Marktforschung und Marketing), in der Technik (Produktentwicklung und Produktion) und in den wissenschaftlichen Anwendungsbereichen (z. B. Medizin, Pharmazie, Biowissenschaften, Psychologie, Pädagogik, Soziologie).

Modularer Aufbau des Kurses

Der fünftägige Komplettkurs besteht ais einem dreitägigen Basiskurs und einem zweitägigen Aufbaukurs. Dieser Kurs ist der zweitägige Aufbaukurs.

Es werden strukturentdeckende Verfahren behandelt, die der Entdeckung von Zusammenhängen zwischen Variablen dienen. Dazu gehören die Zeitreihenanalyse, die Zeitreihen mittels verschiedener Verfahren (exponentielle Prognosemodelle und ARIMA-Modelle) untersucht und Prognosen für zukünftige Entwicklungen erlaubt, die Clusteranalyse, die eine Vielzahl von Fällen zu wenigen Gruppen (Cluster) bündelt, und die explorative Faktorenanalyse, die eine Vielzahl von Variablen zu wenigen Dimensionen (Faktoren) reduziert. Als Ergänzung zur Clusteranalyse wird die Diskriminanzanalyse besprochen, mit der analysiert werden kann, mit welchen Variablen die in der Clusteranalyse gefunden Gruppen am besten beschrieben werden können. Als Ergänzung zur Faktorenanalyse wird die Reliabilitätsanalyse behandelt, die die Eignung und Reliabilität eines Itemsets für einen Faktor prüft. Es wird insbesondere gezeigt, wie mit Hilfe der Faktoren- und Reliabilitätanalyse die Güte eines Fragebogens zur Messung latenter Dimensionen überprüft werden kann.

SG-Seminar-Nr. des entsprechenden Online-Seminars: 5442677

Agenda

  • ZeitreihenanalyseGlättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten, exponentielle Prognosemodelle (State-Space-Modelle) und ARIMA-Modelle, Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen
  • Clusteranalysehierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage, Ward), k-Means-Clusteranalyse
  • DiskriminanzanalyseSchätzung der Diskriminanzfunktion, Prüfung der Modellgüte und der Eignung von Variablen, automatisierte Auswahl von Variablen, Klassifikation von neuen Fällen
  • Explorative FaktorenanalyseHauptachsenanalyse, Hauptkomponentenanalyse, Extraktion und Rotation der Faktoren, Variablenauswahl, Modellgüte, Berechnung von Faktorwerten
  • ReliabilitätsanalysePrüfung des Indikatorsets eines Faktors auf Eindimensionalität; Reliabilitätsprüfung auf Indikatorebene (Indikatorreliabilität): Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation; Prüfung auf Konstruktebene (Faktorreliabilität): Cronbachs Alpha, Inter-Item-Korrelationen, Einheitsstruktur

Lernziele

fortgeschrittene Funktionen von R kennen lernen, Daten mit Hilfe multivariater Verfahren auswerten können, Ergebnisse grafisch darstellen, erläutern und interpretieren können

Zielgruppen

Der R Kurs richtet sich an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung, die mit den fortgeschrittenen Verfahren der multivariaten Statistik mehr aus ihren Daten herausholen wollen.

Voraussetzungen zur Kursteilnahme

Erfahrungen mit R unter Verwendung von RStudio und die Inhalte des Seminars Grundlagen der Statistik mit R (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit R/RStudio – wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren – werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit R/RStudio nicht vertraut sein sollte, empfiehlt es sich, vorher ein R/RStudio-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen.

Termine und Orte

Datum Uhrzeit Dauer Preis
Köln, DE
17.12.2020 - 18.12.2020 09:00 - 18:00 Uhr 16 h Jetzt buchen ›

SG-Seminar-Nr.: 1697588

Anbieter-Seminar-Nr.: MDR-A

Termine

  • 17.12.2020 - 18.12.2020

    Köln, DE

Preise inkl. MwSt. Es können Gebühren anfallen. Für eine exakte Preisauskunft wählen Sie bitte einen Termin aus.

Jetzt buchen ›
Seminar merken ›

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Über Semigator mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Uhrzeit Dauer Preis
Köln, DE
17.12.2020 - 18.12.2020 09:00 - 18:00 Uhr 16 h Jetzt buchen ›