Einführung in Data Science mit Python für Anfänger (Live Online Training) - Webinar von Cegos Integrata GmbH

Inhalte

  • Installation neuer Pakete
  • Verwendung von PyCharm als integrierter Entwicklungsumgebung (IDE)
  • Unterschiede in Funktionen und Methoden
  • Vergleich wichtiger Python-Aspekte mit anderen Programmiersprachen
Arbeiten mit dem pandas-Paket und DataFrames:
  • Struktur eines DataFrames (Zeilen, Spalten)
  • Auswahl von Zeilen und Spalten
  • Erstellen, Löschen und Ändern von Zeilen und Spalten
  • Verwendung von Boolean-Indexing zur Zeilenauswahl anhand logischer Abfragen
  • Zusammenfassung von Daten für einen Überblick
Berechnung von Statistiken direkt in pandas DataFrames:
  • Durchführung einfacher Statistiken direkt auf DataFrames (Durchschnitt, Minimum, Maximum, Summe, Median, Varianz usw.)
  • Aggregation und Filterung von Daten
  • Ersetzen von fehlenden Werten
  • Erstellung von Kreuztabellen (Kontingenztabellen)
Datenverarbeitung: Einlesen und Schreiben von Daten:
  • Festlegung des Arbeitsverzeichnisses in Python und der IDE Spyder
  • Einlesen und Schreiben von CSV- und Excel-Dateien
  • Datenimport von einer URL
  • Übersicht über nützliche Parameter
  • Lesen und Schreiben im Python-Format "pickle"
  • Handhabung großer Datensätze
Kontrollstrukturen:
  • Erstellung eigener Funktionen
  • Festlegung von Standardparametern in Funktionen (Positional Arguments und Keyword Arguments)
  • Anwendung von For-Schleifen
  • Implementierung von If-Else-Bedingungen
  • Verwendung von List Comprehensions mit If-Else
Datenvisualisierung mit seaborn/matplotlib:
  • Grundlegende Aspekte von matplotlib
  • Anpassung von Achsenbeschriftung, Legende und Titel
  • Speichern von Diagrammen
  • Erstellung von Diagrammtypen wie Linien-, Box-, Histogramm-, Scatter- und Balkendiagrammen in seaborn
  • Variation oder Festlegung von Darstellungsmerkmalen (Punktgröße, Farbe, Gruppierung) durch eine Variable
Textmanipulation im DataFrame und Einführung in numpy:
  • Zeilenweise Textbearbeitung in DataFrames
  • Extraktion von Informationen aus Texten
  • Erstellung von numpy-Arrays und Slicing nach Zeilen und Spalten
  • Anwendung von Funktionen auf numpy-Arrays
Überblick über Machine Learning:
  • Einführung in das Konzept des Machine Learnings
  • Praktische Anwendungsbeispiele
  • Unterscheidung von künstlicher Intelligenz, Machine Learning und Deep Learning
  • Erklärung des Unterschieds zwischen überwachtem und unüberwachtem Lernen
  • Besprechung von Overfitting, Train-Test-Split und Kreuzvalidierung
Entscheidungsbaum mit scikit-learn:
  • Datenaufteilung in Test- und Trainingsdaten, Modellerstellung und Validierung
  • Grundlagen des Entscheidungsbaum-Algorithmus
  • Umsetzung in Python
  • Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
  • Anpassung von Hyperparametern während des Trainings
Neuronales Netz und K-Nearest Neighbor:
  • Grundlagen dieser Algorithmen
  • Training eines Multi-Layer-Perceptrons (MLP)
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
  • Anpassung von Hyperparametern
K-Means Clustering:
  • Erstellung und Validierung eines Cluster-Modells
  • Grundlagen des K-Means-Algorithmus
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung
Clustering mit DBSCAN:
  • Funktionsweise des DBSCAN-Clustering-Algorithmus
  • Worin liegt der Unterschied zu K-Means?
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung (Sillhouette Score, Calinski-Harabasz)
Methode

Diese Data Science Schulung beinhaltet eine Vielzahl von Programmieraufgaben. Die Teilnehmer haben die Möglichkeit, diese Aufgaben eigenständig mit Unterstützung des Trainers in Python zu lösen. Das Ziel ist es, das Gelernte zu festigen und zu vertiefen. Bei individuellen Unklarheiten steht der Trainer direkt zur Verfügung, um Fragen zu beantworten.Im Seminar werden in jedem Block (meistens ca. 90 Minuten lang) sowohl theoretische als auch praktische Einheiten behandelt. Die theoretischen Einheiten dienen dazu, das notwendige Wissen zu vermitteln, um die Übungsaufgaben zu verstehen und eigenständig lösen zu können. Dabei konzentrieren wir uns auf den theoretischen Stoff, der das Verständnis verbessert und vermeiden ausführliche, wissenschaftliche Theorieeinheiten. Der Schwerpunkt liegt auf der praktischen Anwendung, also dem Schreiben von Code und dem Lösen von kleinen Verständnisaufgaben. Teilnehmer können jederzeit Fragen stellen, die während der praktischen Einheiten individuell vom Dozenten beantwortet werden. Fragen von allgemeinem Interesse werden allen Teilnehmern erklärt. Sie erhalten die Theorie und weitere Code-Erklärungen als PDF und gedruckte Version. Codebeispiele und Musterlösungen der Übungsaufgaben sind in digitaler Form verfügbar.Die Übungen bestehen hauptsächlich aus Coding-Aufgaben, bei denen Sie entweder kurze Codebeispiele schreiben oder Lücken in vorhandenem Code ergänzen müssen. Letzteres fördert das Verständnis für Code. Die Aufgaben sind so gestaltet, dass sie von allen Teilnehmern innerhalb der verfügbaren Zeit gelöst werden können. Wir haben Aufgaben mit unterschiedlichem Schwierigkeitsgrad vorbereitet, damit schnellere Teilnehmer oder Teilnehmer mit Vorkenntnissen zusätzliche Übungsmöglichkeiten haben. Darüber hinaus gibt es für einige Kapitel kurze Kontrollfragen zum theoretischen Teil.

  • Installation neuer Pakete
  • Verwendung von PyCharm als integrierter Entwicklungsumgebung (IDE)
  • Unterschiede in Funktionen und Methoden
  • Vergleich wichtiger Python-Aspekte mit anderen Programmiersprac ...
Mehr Informationen >>

Lernziele

Der dreitägige Data Science Kurs bietet eine praxisorientierte Einführung in die Grundlagen von Machine Learning mit pandas und scikit-learn in Python. Der Schwerpunkt liegt dabei auf dem Python Modul pandas und seinem DataFrame, das als gängiges Data Science Paket in Python gilt. Zusätzlich werden die Pakete seaborn und matplotlib erläutert, die zur Generierung von Grafiken und Plots verwendet werden. Der Kurs gibt zudem einen Einblick in erste Machine Learning Algorithmen wie Entscheidungsbaum, K-Means Clustering/DBSCAN und Neuronales Netz mit dem Python Paket scikit-learn. Weitere Themen umfassen wichtige Datenstrukturen, das Berechnen von Statistiken, das Schreiben eigener Funktionen sowie das Einlesen und Schreiben von Daten in verschiedenen Formaten. Der Kurs beinhaltet außerdem eine Einführung in lineare Regression, den Train-Test-Split und Kreuzvalidierung.
Der dreitägige Data Science Kurs bietet eine praxisorientierte Einführung in die Grundlagen von Machine Learning mit pandas und scikit-learn in Python. Der Schwerpunkt liegt dabei auf dem Py ... Mehr Informationen >>

Zielgruppen

Der Python Data Science Kurs richtet sich an Teilnehmer, die Python erlernen möchten, um Daten zu analysieren und Machine Learning Algorithmen zu programmieren. Dieser Kurs ist ideal für Anwender, die die Grundlagen der Data Science erlernen möchten.
Der Python Data Science Kurs richtet sich an Teilnehmer, die Python erlernen möchten, um Daten zu analysieren und Machine Learning Algorithmen zu programmieren. Dieser Kurs ist ideal für Anw ... Mehr Informationen >>

Termine und Orte

SG-Seminar-Nr.: 6979852

Anbieter-Seminar-Nr.: 54411(Live Online Training)

Termine

  • 17.06.2024 - 19.06.2024

    Webinar

  • 08.10.2024 - 10.10.2024

    Webinar

  • 02.12.2024 - 04.12.2024

    Webinar

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Webinar
  • Deutsch
    • Teilnahmebestätigung
  • 18 h
  •  
  • Anbieterbewertung (256)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service