Data Science mit R (Live Online Training) - Webinar von Cegos Integrata GmbH

Datenanalyse und Statistik ohne Vorkenntnisse

Inhalte

  • R und RStudio kennenlernen
  • Unterschiede von R zu anderen Programmiersprachen verstehen
  • Datenüberblick verschaffen und erste Diagramme erstellen
  • Installation von Paketen und deren Laden
dplyr (tidyverse) – Grundlagen:
  • Tidyverse kennenlernen
  • Tibble als erweiterte Form von data.frames erkunden
  • Grundlegende Funktionen von dplyr zur Spaltenauswahl kennenlernen
  • Nutzung von select(), filter(), rename() und slice()
Datenmanipulation mit dplyr:
  • Zeilen mit arrange() sortieren
  • Neue Spalten mit mutate() berechnen
  • Statistiken mit summarise() erstellen
  • Verwendung des Pipe Operators %>%
  • Daten mit group_by() gruppieren
  • Umgang mit fehlenden Werten: drop_na() und replace_na()
Berechnung von Statistiken mit dplyr:
  • Wesentliche deskriptive Statistiken anwenden
  • Zufällige Stichproben ziehen
  • Berechnung von Korrelationen
  • Erstellung von Kontingenztabellen
Kontrollstrukturen:
  • Eigene Funktionen erstellen
  • Standardparameter für Funktionen festlegen
  • Anwendung von For-Schleifen
  • Implementierung von If-Else-Bedingungen
Datenvisualisierung mit ggplot2:
  • Konzept der Grammar of Graphics verstehen
  • Nutzung von ggplot2-Layern zur Diagrammerstellung und statistischen Visualisierung
  • Variabilität oder Festsetzung von Darstellungen (Punktgröße, Farbe, Gruppierung) mithilfe einer Variable
  • Erstellung mehrerer Subplots, Anpassung und Speicherung von Diagrammen
Daten einlesen und schreiben:
  • Arbeitsverzeichnis in R und RStudio festlegen
  • Einlesen und Schreiben von CSV-, Excel- und SPSS-Dateien
  • Überblick über nützliche Parameter
  • Verwendung der fread()-Funktion für große Datensätze
Machine Learning:
  • Einführung
  • Anwendungsbeispiele von Machine Learning kennenlernen
  • Unterscheidung zwischen Künstlicher Intelligenz, Machine Learning und Deep Learning
  • Unterschiede zwischen überwachtem und unüberwachtem Lernen verstehen
  • Überfitting, Train-Test-Split und Kreuzvalidierung kennenlernen
Lineare Regression:
  • Daten in Test- und Trainingsdaten aufteilen, Modell erstellen und validieren
  • Grundlagen der linearen Regression verstehen
  • Umsetzung der linearen Regression in R
  • Ergebnisse validieren, z. B. durch die mittlere quadratische Abweichung (mean squared error)
Entscheidungsbaum in R:
  • Daten in Test- und Trainingsdaten aufteilen, Modell erstellen und validieren
  • Grundlagen von Entscheidungsbäumen verstehen
  • Umsetzung eines Entscheidungsbaums in R
  • Ergebnisse validieren, u. a. durch Verwendung der Verwirrungsmatrix, Sensitivität und Genauigkeit
  • Anpassung von Hyperparametern während des Trainings
Weitere Machine Learning-Algorithmen in R:
  • Überblick über Random Forest und K-means erhalten
  • Umsetzung der Algorithmen in R kennenlernen
  • Ergebnisse der Algorithmen validieren und interpretieren
Methode

In diesem Data Mining Training liegt der Fokus auf der praktischen Anwendung. Die Teilnehmer haben die Möglichkeit, eigenständig mit RStudio zu programmieren, um das Gelernte zu üben und eventuelle Unklarheiten sofort zu klären. Der Trainer steht zur Verfügung, um bei Lösungen zu unterstützen und weiterführende Fragen zu beantworten.

  • R und RStudio kennenlernen
  • Unterschiede von R zu anderen Programmiersprachen verstehen
  • Datenüberblick verschaffen und erste Diagramme erstellen
  • Installation von Paketen und deren Laden
dplyr ... Mehr Informationen >>

Lernziele

In diesem Kurs werden Ihnen grundlegende Kenntnisse über die Programmiersprache R vermittelt, die in den Bereichen Statistik, Data Science und Machine Learning weit verbreitet ist. Sie werden RStudio als Entwicklungsumgebung kennenlernen, die am häufigsten für R verwendet wird. Nach Abschluss des Kurses werden Sie in der Lage sein, Daten aus verschiedenen Formaten einzulesen, Daten mit ggplot2 zu visualisieren und Daten mit dplyr aus tidyverse zu bereinigen (z.B. fehlende Werte ersetzen, Zeilen und Spalten anpassen, neue Spalten erstellen).Sie werden in der Lage sein, eigene einfache Funktionen zu schreiben und Control Flows (z.B. For-Schleifen, If-Else-Anweisungen) in R umzusetzen. Sie werden das Grundkonzept von tidyverse/dplyr verstehen und in der Lage sein, Data Wrangling und Data Cleaning durchzuführen.Der Kurs wird Ihnen die verschiedenen Arten des Machine Learning (überwacht, unüberwacht und verstärkt) vorstellen. Sie werden in der Lage sein, Algorithmen in R eigenständig zu trainieren, zu validieren, einen Train-Test Split durchzuführen und Gütekriterien zur Bewertung von Algorithmen zu berechnen und zu interpretieren. Sie werden bekannte Machine Learning Algorithmen wie lineare Regression, logistische Regression, Entscheidungsbaum, Random Forest und k-means Clustering verstehen und in R implementieren können.Nach Abschluss des Kurses werden Sie in der Lage sein, R eigenständig für Machine Learning und Data Science zu verwenden und Ihr Wissen weiter auszubauen. Der Schwerpunkt des Kurses liegt auf der praktischen Anwendung in RStudio mit Unterstützung des Dozenten.
In diesem Kurs werden Ihnen grundlegende Kenntnisse über die Programmiersprache R vermittelt, die in den Bereichen Statistik, Data Science und Machine Learning weit verbreitet ist. Sie werden RSt ... Mehr Informationen >>

Zielgruppen

Dieses Seminar richtet sich an Fachleute, die in ihrem Unternehmen in den Bereichen Data Science, Datenanalyse mit R oder verwandten Bereichen wie Machine Learning oder Data Analysis tätig sind oder sein werden. Es konzentriert sich auf den Einsatz von Machine Learning-Algorithmen.
Dieses Seminar richtet sich an Fachleute, die in ihrem Unternehmen in den Bereichen Data Science, Datenanalyse mit R oder verwandten Bereichen wie Machine Learning oder Data Analysis tätig sind o ... Mehr Informationen >>

Termine und Orte

SG-Seminar-Nr.: 6979768

Anbieter-Seminar-Nr.: 54410(Live Online Training)

Termine

  • 15.07.2024 - 17.07.2024

    Webinar

  • 28.10.2024 - 30.10.2024

    Webinar

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Webinar
  • Deutsch
    • Teilnahmebestätigung
  • 18 h
  •  
  • Anbieterbewertung (256)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service