Grundlagen der Statistik mit R (Präsenz), Komplett - Seminar / Kurs von DHL Data Science Seminare GmbH

Inhalte

Der Kurs bietet eine verständnisorientierte Einführung in die zentralen statistischen Verfahren der angewandten Statistik, in die statistische Programmiersprache R, in die Entwicklungsumgebung RStudio und in die R-Bibliothek Tidyverse.

Der Kurs "Grundlagen der Statistik mit R” bietet eine verständnisorientierte Einführung in die zentralen statistischen Verfahren der deskriptiven Statistik, der schließenden Statistik und der angewandten Statistik. Neben den statistischen Inhalten steht die Programmiersprache R im Vordergrund: Sie erhalten eine fundierte Einführung in die grundlegenden Funktionen der Programmiersprache R und die Entwicklungsumgebung RStudio mit den modernen und zeitgemäßen Funktionen der R-Pakete tidyverse und rstatix für den Datenimport, die Datenaufbereitung, die Datenanalyse und der Präsentation von Ergebnissen. Die Weiterbildung erfolgt unter Zuhilfenahme professioneller Didaktik durch den Wechsel von Input und anwendungsbezogenen Übungen mit R und RStudio.

Der Nutzen des Seminars besteht darin, dass durch den Kurs auch Anfänger innerhalb einer Woche in die Lage versetzt werden, Daten mit den statistischen Standardverfahren zu analysieren und deren Ergebnisse korrekt zu interpretieren. Es werden dabei die leistungsfähigen R-Pakete tidyverse und rstatix eingesetzt, mit denen Daten effizient ausgewertet und professionell wirkende Grafiken und Tabellen publikationsfertig erstellt werden können.

Dieses Seminar vermittelt über die Einführung in statistische Grundlagen hinaus Expertenwissen für statistische Datenanalysen. Es werden reale Daten mit typischen Stolpersteinen verwendet und es wird dabei aufgezeigt, wie durch unachtsame Anwendung der Standardverfahren verzerrte oder sogar nicht zutreffende und falsche Ergebnisse entstehen können.

Diese Weiterbildung ist sowohl für Personen ohne Vorkenntnisse als auch solchen mit Programmierkenntnissen geeignet. In den praktischen Übungsblöcken werden Übungsaufgaben unterschiedlichen Schwierigkeitsgrads gestellt, so dass alle etwas finden und ihre Lernziele erreichen können.

Modularer Aufbau des Kurses

Der fünftägige Komplettkurs besteht ais einem zweitägigen Basiskurs und einem dreitägigen Aufbaukurs. Dieser Kurs ist der fünftägige Komplettkurs.

Das zweitägige Basistraining vom R-Kurs bietet eine Einführung in die Programmierung mit R und RStudio und in die Methoden des Datenimports und der Datenaufbereitung mit den R-Paketen der Bibliothek des tidyverse: Sie lernen, Daten mit readxl und readr einzulesen, mit tidyr umzustrukturieren, mit dplyr zu selektieren, sortieren, gruppieren und transformieren und mit ggplot2 professionell zu visualisieren. Sie erhalten außerdem eine fundierte Einführung in die deskriptive Statistik mit den folgenden statistischen Konzepten und Grundbegriffen und deren Umsetzung mit Hilfe des R-Pakets rstatix: Grundgesamtheit, Stichprobe, Variablen, Häufigkeiten, Dateneingabe, Datenimport, Datenaufbereitung, Datenanalyse, deskriptive Statistik (Beschreibung von Stichproben mit Häufigkeitstabellen und Zentral-, Streuungs- und Zusammenhangsmaßen) und die Darstellung von statistischen Ergebnissen mit Grafiken wie Histogrammen, Balkendiagrammen, Kreisdiagrammen, Boxplots, Streudiagrammen und Liniendiagrammen, die hochprofessionell mit ggplot2 und publikationsfertig mit ggpubr erstellt werden.

In dem dreitägigen Aufbautraining vom R-Kurs wird in die schließende Statistik und die Anwendung von statistischen Tests (auch Signifikanztests oder Hypothesentests genannt) und dem multivariaten Verfahren der Varianzanalyse mit den folgenden statistischen Methoden und deren Umsetzung mit dem R-Paket rstatix eingeführt: parametrische und verteilungsfreie Signifikanztests (inkl. Häufigkeitsanalysen und Kontingenzanalysen) und die verschiedenen Varianten der Varianzanalyse. Die Varianzanalyse erlaubt die simultane Analyse einer Vielzahl von Mittelwerten verschiedener Einflussgrößen bzw. (Teil-) Stichproben und ist hinsichtlich Präzision und Arbeitsaufwand ein Vielfaches dem t-Test für den Mittelwertsvergleich überlegen. Die Varianzanalyse ist außerdem das Verfahren der ersten Wahl zur Evaluation von Änderungen, Maßnahmen und Interventionen und zur Auswertung von randomisierten kontrollierten Studien im Rahmen von Pretest-Posttest-Designs mit einer Kontrollstichprobe.

Agenda

  • Einführung in R und RStudio
    • R-Pakete installieren und verwenden
    • Projekte anlegen und verwalten
    • Workspace und Global Environment
    • Variablen, Datentypen und Datenstrukturen
    • Funktionen des klassischen R (Base R)
    • R-Skripte entwickeln und testen
  • Datenimport/-export und Datenaufbereitung mit der R-Bibliothek tidyverse
    • Text- und Exceldateien importieren mit readr und readxl
    • Daten und Ergebnisse exportieren mit openxlsx
    • Daten umstrukturieren mit tidyr
    • Daten transformieren, selektieren, gruppieren und sortieren mit dplyr
  • Deskriptive Statistik mit dem R-Paket rstatix
    • Zentralmaße, Streuungsmaße und Häufigkeiten
    • Häufigkeitstabellen und Kreuztabellen
    • Erstellen von Tabellen mit deskriptiven Kennwerten
    • Korrelationen und Zusammenhangsmaße
    • Diagramme mit ggplot2 und ggpubr erstellen (Balkendiagramme, Kreisdiagramme, Histogramme, Boxplots, Liniendiagramme und Streudiagramme)
  • Einführung in die schließende Statistik (statistische Tests)
    • Statistisches Testen anhand von Stichproben
    • Wahrscheinlichkeitsverteilungen (Normalverteilung)
    • Nullhypothesentest nach Fisher (Signifikanztest)
    • p-Werte, Effektgrößen (Cohens d, Hedges g) und Konfidenzintervalle
  • Parametrische Verfahren mit dem R-Paket rstatix
    • z-Test und t-Test für eine Stichprobe zur Prüfung der Abweichung eines Mittelwerts von einem vorgegebenen Wert
    • t-Test zur Signifikanzprüfung des Unterschieds zweier Mittelwerte aus unabhängigen oder verbundenen Stichproben
    • Levene-Test zur Signifikanzprüfung von Varianzen und Standardabweichungen
    • Shapiro-Wilk-Test zur Signifikanzprüfung der Normalverteilungsannahme
    • Prüfung der Wirksamkeit von Aktionen, Maßnahmen, Interventionen und anderen Veränderungen mit t-Tests (Pretest-Posttest-Designs mit Kontrollstichprobe)
  • Verteilungsfreie Verfahren mit dem R-Paket rstatix
    • U-Test von Wilcoxon-Mann-Whitney und Wilcoxon-(Vorzeichenrang-)Test zur Signifikanzprüfung von Medianen
    • Binomialtest und exakter Test nach Fisher zur Signifikanzprüfung von Häufigkeiten
    • Kontingenzanalyse mit Chi-Quadrat-Test zur Signifikanzprüfung von Häufigkeiten einer Kreuztabelle
  • Varianzanalysen mit dem R-Paket rstatix
    • ein-, zwei- und mehrfaktorielle Varianzanalyse (inkl. Korrektur der Standardfehler bei Heteroskedastizität und generalisiertes Eta-Quadrat)
    • Messwiederholungsdesigns (mixed ANOVA) und Kontrolle von Störeinflüssen (ANCOVA)
    • t-Tests im Rahmen der Varianzanalyse (Post-hoc-Mehrfachvergleiche: Tukey-Kramer HSD, Games-Howell HSD, Duncans MRT, Dunnetts Test; paarweise Einzelvergleiche mit Alphafehler-Korrektur: Bonferroni, Holm und Jianjun Li)
    • Interaktionsanalyse (Wechselwirkungen aufgrund sich verstärkender oder hemmender Effekte)
    • Statistische Auswertung von Pretest-Posttest-Designs mit Varianzanalysen

Lernziele

Nutzen der Weiterbildung: Der Nutzen des R-Kurses besteht darin, dass Sie innerhalb einer Woche in die Lage versetzt werden, Daten mit Hilfe der statistischen Programmiersprache R aufbereiten, analysieren, interpretieren und visualisieren zu können. Damit dies gelingt, wird nicht nur das theoretische Hintergrundwissen vermittelt, sondern auch die praktische Anwendung und Umsetzung mit der weltweit am meisten eingesetzten und umfangreichsten statistischen Analyse-Umgebung R mit RStudio. Dabei werden die aktuell leistungsfähigsten R-Pakete zur effizienten Auswertung und professionellen Erstellung von publikationsfertigen Grafiken und Tabellen eingesetzt: tidyverse, rstatix und ggplot2 mit ggpubr. Damit Sie den vollen Nutzen der Weiterbildung erfahren können, empfiehlt es sich, den kompletten Kurs mit beiden Teilkursen zu belegen.

Lernziele der Weiterbildung: In diesem R-Kurs lernen Sie, die Grundfunktionen der Entwickungsumgebung RStudio und der Programmiersprache R zu lernen, R-Skripte erstellen, testen und debuggen zu können, die Grundlagen der deskriptiven und schließenden Statistik verstehen und anwenden zu können, Ergebnisse von deskriptiven Auswertungen, Signifikanztests und Varianzanalysen darstellen, erläutern und interpretieren zu können, Daten mit readr und readxl importieren, mit tidyr und dplyr aufbereiten, mit rstatix auswerten und die Ergebnisse mit openxlsx exportieren und mit ggplot2 und ggpubr visualisieren zu können.

Zielgruppen

Diese Weiterbildung ist sowohl für Anfänger als auch Programmierer mit wenig oder keinen Erfahrungen in Statistik, Datenanalysen und der Anwendung der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio konzipiert, die eine Einführung in die Grundlagen der deskriptiven und schließenden Statistik und deren professionelle Anwendung mit R und RStudio suchen. Inhaltlich richtet sich das R-Seminar an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung. Die Verfahren sind dabei in allen empirischen Wissenschaften anwendbar.

Inhaltliche Voraussetzungen zur Kursteilnahme

Es werden für das Basis-Training bzw. für das Komplett-Training allgemeine Computerkenntnisse (Erfahrung in der Anwendung von Textverarbeitungs- und Tabellenkalkulationsprogrammen) und Grundkenntnisse in der Mathematik (Grundkenntnisse in der Statistik sind von Vorteil, aber nicht erforderlich) vorausgesetzt. Sie sollten in der Lage sein, relativ routiniert und fehlerfrei zu tippen (häufige Tippfehler erschweren den Lernfortschritt). 

Keine technischen Voraussetzungen zur Kursteilnahme

In dieser Präsenzveranstaltung werden Ihnen Schulungsunterlagen und ein Schulungslaptop mit der erforderlichen Software im Seminarraum zur Verfügung gestellt.

Der Kurs bietet eine verständnisorientierte Einführung in die zentralen statistischen Verfahren der angewandten Statistik, in die statistische Programmiersprache R, in die Entwicklungsumgebung RStudi ... Mehr Informationen >>

Termine und Orte

SG-Seminar-Nr.: 5701177

Anbieter-Seminar-Nr.: K-GSR-K

Termine

  • 23.06.2025 - 27.06.2025

    Köln, DE

  • 15.12.2025 - 19.12.2025

    Köln, DE

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›
Vergleichen

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Seminar / Kurs
  • Deutsch
    • Keine
  • 40 h
  •  
  • Anbieterbewertung (4)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service