Grundlagen der Statistik mit Python (Präsenz), Komplett - Seminar / Kurs von DHL Data Science Seminare GmbH

Inhalte

Der Kurs bietet eine verständnisorientierte Einführung in die statistischen Standardverfahren der angewandten Statistik, in die Programmiersprache Python und in die Entwicklungsumgebung Spyder.

Der Kurs "Grundlagen der Statistik mit Python” bietet als Weiterbildung eine verständnisorientierte Einführung in die zentralen statistischen Verfahren der deskriptiven Statistik, der schließenden Statistik und der angewandten Statistik. Neben den statistischen Inhalten steht die Programmiersprache Python und Python lernen im Vordergrund: Sie erhalten eine fundierte Einführung in die grundlegenden Funktionen der Programmiersprache Python und die Entwicklungsumgebung Spyder mit den gängigen Methoden und Verfahren des Datenimports, der Datenaufbereitung, der Datenanalyse und der Präsentation von Ergebnissen. Die Weiterbildung erfolgt unter Zuhilfenahme professioneller Didaktik durch den Wechsel von Input und anwendungsbezogenen Übungen mit Python und Spyder vermittelt.

Der Nutzen des Seminars besteht darin, dass durch den Kurs auch Anfänger innerhalb einer Woche in die Lage versetzt werden, Daten mit den statistischen Standardverfahren zu analysieren und deren Ergebnisse korrekt zu interpretieren. Es werden dabei leistungsfähige Python-Pakete eingesetzt, mit denen Daten effizient ausgewertet und professionell wirkende Grafiken publikationsfertig erstellt werden können.

Dieser Python-Kurs Grundlagen der Statistik mit Python vermittelt über die Einführung in statistische Grundlagen hinaus Expertenwissen für statistische Datenanalysen. Es werden reale Daten mit typischen Stolpersteinen verwendet und es wird dabei aufgezeigt, wie durch unachtsame Anwendung der Standardverfahren verzerrte oder sogar nicht zutreffende und falsche Ergebnisse entstehen können.

Dieser Kurs ist sowohl für Personen ohne Vorkenntnisse als auch solchen mit Programmierkenntnissen geeignet. In den praktischen Übungsblöcken werden Übungsaufgaben unterschiedlichen Schwierigkeitsgrads gestellt, so dass alle etwas finden und ihre Lernziele erreichen können.

Modularer Aufbau des Kurses

Der fünftägige Komplettkurs besteht ais einem zweitägigen Basiskurs und einem dreitägigen Aufbaukurs. Dieser Kurs ist der fünftägige Komplettkurs.

Das zweitägige Basistraining bietet eine Einführung in die Grundfunktionen von Python und Spyder und in die deskriptive Statistik mit den folgenden statistischen Konzepten und Grundbegriffen und deren Umsetzung mit Hilfe des Python-Pakets pandas: Grundgesamtheit, Stichprobe, Variablen, Häufigkeiten, Datenimport, Datenaufbereitung, Datenanalyse, deskriptive Statistik (Beschreibung von Stichproben mit Häufigkeitstabellen und Zentral-, Streuungs- und Zusammenhangsmaßen) und die professionelle Darstellung von statistischen Ergebnissen mit Grafiken wie Histogramme, Balkendiagramme, Kreisdiagramme, Boxplots, Streudiagramme und Liniendiagramme, die mit seaborn und matplotlib erstellt werden.

In dem dreitägigen Aufbautraining wird in die schließende Statistik und die Anwendung von statistischen Tests (auch Signifikanztests oder Hypothesentests genannt) und dem multivariaten Verfahren der Varianzanalyse mit den folgenden statistischen Methoden und deren Umsetzung mit den Python-Paketen SciPy und statsmodels eingeführt: parametrische und verteilungsfreie Signifikanztests (inkl. Häufigkeitsanalysen und Kontingenzanalysen) mit dem Python-Paket SciPy und die verschiedenen Varianten der Varianzanalyse mit dem Python-Paket statsmodels. Die Varianzanalyse erlaubt die simultane Analyse einer Vielzahl von Mittelwerten verschiedener Einflussgrößen bzw. (Teil-) Stichproben und ist hinsichtlich Präzision und Arbeitsaufwand ein Vielfaches dem t-Test für den Mittelwertsvergleich überlegen. Die Varianzanalyse ist außerdem das Verfahren der ersten Wahl zur Evaluation von Änderungen, Maßnahmen und Interventionen und zur Auswertung von randomisierten kontrollierten Studien im Rahmen von Pretest-Posttest-Designs mit einer Kontrollstichprobe.

Agenda

  • Einführung in Python und Spyder
    • Python-Bibliotheken mit Anaconda installieren
    • Anaconda und die Entwicklungsumgebung Spyder
    • Variablen, Datentypen, Ausdrücke, Operatoren und Operanden
    • Python-Kollektionen string und list
    • Python-Skripte entwickeln und testen
  • Datenimport/-export und Datenaufbereitung mit pandas
    • Daten importieren und exportieren
    • Daten transformieren und umkodieren
    • Kategoriale Variablen erstellen
    • Daten selektieren und Subsets erstellen
  • Deskriptive Statistik mit pandas
    • Zentralmaße, Streuungsmaße und Häufigkeiten
    • Häufigkeitstabellen und Kreuztabellen
    • Erstellen von Tabellen mit deskriptiven Kennwerten
    • Korrelationen und Zusammenhangsmaße
    • Diagramme mit seaborn und matplotlib erstellen (Balkendiagramme, Kreisdiagramme, Histogramme, Boxplots, Liniendiagramme und Streudiagramme)
  • Einführung in die schließende Statistik (Signifikanztests)
    • Statistisches Testen anhand von Stichproben
    • Wahrscheinlichkeitsverteilungen (Normalverteilung)
    • Hypothesentests nach Fisher und Neyman-Pearson (Signifikanztests)
    • p-Werte, Effektgrößen und Konfidenzintervalle
  • Parametrische Verfahren mit SciPy
    • z-Test und t-Test für eine Stichprobe zur Prüfung der Abweichung eines Mittelwerts von einem vorgegebenen Wert
    • t-Test zur Signifikanzprüfung des Unterschieds zweier Mittelwerte aus unabhängigen oder verbundenen Stichproben
    • Levene-Test zur Signifikanzprüfung von Varianzen und Standardabweichungen
    • Kolmogoroff-Smirnow-Test und Shapiro-Wilk-Test zur Signifikanzprüfung der Normalverteilungsannahme
    • Prüfung der Wirksamkeit von Aktionen, Maßnahmen, Interventionen und anderen Veränderungen mit t-Tests (Pretest-Posttest-Designs mit Kontrollstichprobe)
  • Nichtparametrische Verfahren mit SciPy
    • U-Test von Wilcoxon-Mann-Whitney und Wilcoxon-(Vorzeichenrang-)Test zur Signifikanzprüfung von Medianen
    • Binomialtest und exakter Test nach Fisher zur Signifikanzprüfung von Häufigkeiten
    • Kontingenzanalyse mit Chi-Quadrat-Test zur Signifikanzprüfung von Häufigkeiten einer Kreuztabelle
  • Varianzanalysen mit statsmodels
    • ein-, zwei- und mehrfaktorielle Varianzanalyse
    • Messwiederholungsdesigns und Kontrolle von Störeinflüssen
    • robuste Formen der Varianzanalyse (robuste Standardfehler nach MacKinnon & White, Test der Homoskedastizität-Annahme nach White & Breusch-Pagan)
    • t-Tests im Rahmen der Varianzanalyse (Post-hoc-Mehrfachvergleiche: Tukey HSD und Games-Howell)
    • Interaktionsanalyse (Wechselwirkungen aufgrund sich verstärkender oder hemmender Effekte)
    • Statistische Auswertung von Pretest-Posttest-Designs mit Varianzanalysen

Lernziele

Nutzen der Weiterbildung: Der Nutzen des Seminars besteht für Sie darin, dass Sie innerhalb einer Woche in die Lage versetzt werden, Daten mit Hilfe der Programmiersprache Python aufbereiten, analysieren, interpretieren und visualisieren zu können. Damit dies gelingt, wird nicht nur das theoretische Hintergrundwissen vermittelt, sondern auch die praktische Anwendung und Umsetzung mit der von Experten im Bereich von Data Science und der künstlichen Intelligenz bevorzugt eingesetzten statistischen Analyse-Umgebung Python mit Spyder. Dabei werden die zurzeit leistungsfähigsten Python-Pakete zur professionellen Erstellung von publikationsfertigen Grafiken und Tabellen eingesetzt: pandas, SciPy, statsmodels und seaborn mit matplotlib. Damit Sie den vollen Nutzen des Seminars erfahren können, empfiehlt es sich, den kompletten Kurs mit beiden Teilkursen zu belegen.

Lernziele der Weiterbildung: In diesem Kurs lernen Sie die Grundfunktionen der Entwickungsumgebung Sypder und der Programmiersprache Python, mit der interaktiven Shell IPython umzugehen, die Grundlagen der deskriptiven und schließenden Statistik anzuwenden, Daten zu importieren, aufzubereiten und auszuwerten, einfache Python-Skripte zu erstellen und zu testen, Ergebnisse von deskriptiven Auswertungen, Signifikanztests und Varianzanalysen darzustellen, zu erläutern und zu interpretieren und Grafiken mit seaborn zu erstellen.

Zielgruppen

Diese Weiterbildung ist sowohl für Anfänger als auch Programmierer mit wenig oder keinen Erfahrungen in Statistik, Datenanalysen und der Anwendung der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio konzipiert, die eine Einführung in die Grundlagen der deskriptiven und schließenden Statistik und deren professionelle Anwendung mit R und RStudio suchen. Inhaltlich richtet sich das R-Seminar an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung. Die Verfahren sind dabei in allen empirischen Wissenschaften anwendbar.

Inhaltliche Voraussetzungen zur Kursteilnahme

Es werden für das Basis-Training bzw. für das Komplett-Training allgemeine Computerkenntnisse (Erfahrung in der Anwendung von Textverarbeitungs- und Tabellenkalkulationsprogrammen) und Grundkenntnisse in der Mathematik (Grundkenntnisse in der Statistik sind von Vorteil, aber nicht erforderlich) vorausgesetzt. Sie sollten in der Lage sein, relativ routiniert und fehlerfrei zu tippen (häufige Tippfehler erschweren den Lernfortschritt). 

Keine technischen Voraussetzungen zur Kursteilnahme

In dieser Präsenzveranstaltung werden Ihnen Schulungsunterlagen und ein Schulungslaptop mit der erforderlichen Software im Seminarraum zur Verfügung gestellt.

 

Der Kurs bietet eine verständnisorientierte Einführung in die statistischen Standardverfahren der angewandten Statistik, in die Programmiersprache Python und in die Entwicklungsumgebung Spyder.

Der ...

Mehr Informationen >>

Termine und Orte

SG-Seminar-Nr.: 5701176

Anbieter-Seminar-Nr.: K-GPP-K

Termine

  • 10.03.2025 - 14.03.2025

    Köln, DE

  • 01.09.2025 - 05.09.2025

    Köln, DE

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›
Vergleichen

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Seminar / Kurs
  • Deutsch
    • Keine
  • 40 h
  •  
  • Anbieterbewertung (4)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service