Multivariate Datenanalyse mit Python (Köln), Basis in Köln - Seminar / Kurs von DHL Data Science Seminare GmbH

Der Kurs Multivariate Datenanalyse mit Python führt in die multivariate Statistik ein. Schwerpunkt des Basiskurses sind Regressionsmodelle (lineare und nicht-lineare Regressionsanalyse, logistische Regression).

Inhalte

Der Kurs "Multivariate Datenanalyse mit Python" führt als Weiterbildung für fortgeschrittene Anwender in die multivariate Statistik ein. Die Anwendung der multivariaten Verfahren mit der Programmiersprache Python wird mit vielen Beispielen und Übungsaufgaben trainiert und vertieft. Das Ziel der Python-Schulung ist es, multivariate Verfahren mit Python anwenden zu können.

Der Nutzen des Seminars besteht darin, dass durch diesen Python-Kurs fortgeschrittene Anwender innerhalb von einer Woche in die Lage versetzt werden, multivariate Verfahren anzuwenden und die Ergebnisse korrekt zu interpretieren. Multivariate Verfahren erlauben es, die Variablen in einem Datensatz gemeinsam zu analysieren und sind somit den univariaten Verfahren des Grundlagenkurses Grundlagen der Statistik mit Python überlegen. Die Vorteile werden im nächsten Abschnitt erläutert.

Was sind multivariate Verfahren?

Die Multivariate Statistik untersucht den Einfluss von mehreren statistischen Variablen zugleich. Zusammenhangsstrukturen zwischen den Variablen können nur mit den multivariaten Verfahren der multivariaten Statistik erkannt werden. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird. Die univariaten Verfahren werden in dem Python-Kurs Grundlagen der Statistik mit Python vermittelt.

Multivariate Verfahren wollen im Wesentlichen die in einem Datensatz enthaltene Zahl der Variablen reduzieren, im Ergebnis aber die Gesamtheit der enthaltenen Information berücksichtigen. Dazu wird die Struktur der Daten analysiert. Entweder gibt man im Rahmen der multivariaten Statistik eine Struktur vor und prüft mit Hilfe strukturprüfender Verfahren, ob die Daten mit der vorgegebenen Struktur zusammenpassen, oder man versucht im Rahmen der explorativen Statistik, die Struktur zu entdecken und aus den Daten zu extrahieren.

Beide Verfahrensarten der multivariaten Statistik ergänzen sich häufig. So werden beispielsweise mit Hilfe der Clusteranalyse verschiedene, voneinander abgrenzbare Kundengruppen bestimmt. Mittels einer nachgeschalteten Diskriminanzanalyse können dann die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich voneinander unterscheiden lassen. Mit den gewonnenen Erkenntnissen kann bei neuen Fällen die Gruppenzugehörigkeit prognostiziert werden. Oder eine Vielzahl von zu analysierenden Variablen werden zunächst mit Hilfe einer Faktorenanalyse auf wenige Faktoren reduziert. Anschließend werden die auf diese Weise ermittelten Faktoren mit Regressions-, Varianz- oder Zeitreihenanalysen untersucht.

Multivariate Verfahren werden erfolgreich in den verschiedensten Feldern eingesetzt wie beispielsweise in den betriebswirtschaftlichen Anwendungsbereichen (Marktforschung und Marketing), in der Technik (Produktentwicklung und Produktion) und in den wissenschaftlichen Anwendungsbereichen (Naturwissenschaften, Biowissenschaften, Sozialwissenschaften, Medienwissenschaften, Medizin, Pharmazie, Psychologie, Pädagogik, Soziologie usw., um nur einige zu nennen).

Modularer Aufbau des Kurses

Der fünftägige Komplettkurs besteht ais einem dreitägigen Basiskurs und einem zweitägigen Aufbaukurs. Dieser Kurs ist der dreitägige Basiskurs.

Im dreitägigen Basistraining vom Python-Kurs Multivariate Datenanalyse mit Python werden die regressionsanalytischen Verfahren behandelt. Dazu gehören die multiple Regressionsanalyse, die die linearen und nichtlinearen Zusammenhänge zwischen mehreren Variablen quantitativ beschreibt und erklärt und Prognosen erlaubt, und die logistische Regression, die zur Klassifizierung und Risikoabschätzung von Einzelfällen geeignet ist. Im dreitägigen Basistraining wird bei beiden Verfahren gezeigt, wie lineare, nicht-lineare und kategoriale Einflussgrößen und deren Wechselwirkungen modelliert werden. Mit diesen fortgeschrittenen Kenntnissen können komplexe und realitätsnahe Regressionsmodelle mit hohem Erklärungswert und sehr guten Prognosen entwickelt werden.

Agenda

  • Multiple RegressionsanalyseRegressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); automatisierte Verfahren zur Auswahl von Prognosevariablen und der Ermittlung des am besten an die Daten angepassten Modells; Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen
  • Logistische RegressionSchätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo Python-Quadrat-Statistiken)

Der Kurs "Multivariate Datenanalyse mit Python" führt als Weiterbildung für fortgeschrittene Anwender in die multivariate Statistik ein. Die Anwendung der multivariaten Verfahren mit der Programmierspr ...

Mehr Informationen >>

Lernziele

Nutzen der Weiterbildung: Der Nutzen des Seminars besteht darin, dass Sie durch diesen Python-Kurs innerhalb von einer Woche in die Lage versetzt werden, multivariate Verfahren auf einem hohen Niveau anzuwenden und zu interpretieren. Damit dies gelingt, wird nicht nur das theoretische Hintergrundwissen vermittelt, sondern auch die praktische Anwendung und Umsetzung mit der von Experten im Bereich von Data Science und der künstlichen Intelligenz bevorzugt eingesetzten statistischen Analyse-Umgebung Python mit Spyder. Dabei werden die aktuell leistungsfähigsten Python-Pakete zur effizienten Auswertung und professionellen Erstellung von publikationsfertigen Grafiken und Tabellen eingesetzt. Damit Sie den vollen Nutzen der Weiterbildung erfahren können, empfiehlt es sich, den kompletten Kurs mit beiden Teilkursen zu belegen.

Lernziele der Weiterbildung: fortgeschrittene Funktionen von Python kennen lernen, Daten mit Hilfe der multivariaten Statistik auswerten können, Ergebnisse von multivariaten Verfahren grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Nutzen der Weiterbildung: Der Nutzen des Seminars besteht darin, dass Sie durch diesen Python-Kurs innerhalb von einer Woche in die Lage versetzt werden, multivariate Verfahren auf einem hohen Niveau ...

Mehr Informationen >>

Zielgruppen

Der Kurs richtet sich an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung, die mit den fortgeschrittenen Verfahren der multivariaten Statistik mehr aus ihren Daten herausholen wollen.

Inhaltliche Voraussetzungen zur Kursteilnahme

Die Inhalte des Kurses   ?Grundlagen der Statistik mit Python"   werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit Python und Spyder ? wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren ? werden vorausgesetzt, ständig angewendet und vertieft.

Technische Voraussetzungen zur Kursteilnahme

Bitte bringen Sie zur Teilnahme an dem Präsenzseminar Ihren Lapop mit der von Ihnen bislang genutzen Python-Umgebung mit. Sie erhalten außerdem eine Installationsanleitung für die Aktualisierung der Installation und der im Unterricht verwendeten Python-Pakete. Bei Bedarf können Sie einen  fertig konfigurierten Schulungslaptop mieten, der im Seminarraum zur Verfügung gestellt wird.

Der Kurs richtet sich an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psycholo ...

Mehr Informationen >>

SG-Seminar-Nr.: 6372243

Anbieter-Seminar-Nr.: K-MDP-B

Termin

11.12.2023 - 13.12.2023 , 08:00 - 17:00 Uhr

Colonius Carré
Subbelrather Straße 15a
50823 Köln

Günstige Preise

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

€ 1.779,05

Alle Preise inkl. 19% MwSt.

Jetzt anfragen
Seminar merken ›

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Seminar / Kurs
  • Deutsch
    • Teilnahmebestätigung
  •  
  • Anbieterbewertung (4)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service