Inhouse

Bootcamp - Machine Learning und Data Science mit Python (Inhouse)

Inhalte

  • Python-Essentials:
    • Installation von neuen Modulen
    • Jupyter Notebooks / Jupyter Lab
    • Verwendung von Funktionen und Methoden
    • Python im Vergleich zu anderen Sprachen
    Grundlegende Datenstrukturen:
    • Einführung in grundlegende Datentypen (String, Integer, Float, NaN)
    • Erläuterung wichtiger Strukturen: Liste, Tupel, Wörterbuch
    • Einführung in List Comprehension
    pandas-Datenverarbeitung - DataFrames:
    • Erkunden der DataFrame-Struktur (Zeilen, Spalten)
    • Auswahl von Zeilen/Spalten
    • Erstellen, Löschen und Bearbeiten von Zeilen/Spalten
    • Boolean Indexing für Zeilenauswahl
    Statistiken direkt in pandas DataFrames berechnen:
    • Einfache Statistiken auf DataFrames (Mittelwert, Min, Max, Summe, Median, Varianz usw.)
    • Daten aggregieren und filtern
    • Fehlende Werte behandeln
    • Kreuztabellen erstellen
    Programmablaufsteuerung:
    • Eigene Funktionen erstellen
    • Default-Parameter in Funktionen festlegen (Positional und Keyword Arguments)
    • For-Schleifen verwenden
    • If-Else-Bedingungen implementieren
    Datendarstellung mit seaborn / matplotlib:
    • Grundlagen von matplotlib kennenlernen
    • Anpassung von Achsen, Legende, Titel
    • Diagramme speichern
    • In seaborn verschiedene Diagrammtypen erstellen
    • Darstellungen variieren/festsetzen (Größe, Farbe, Gruppierung)
    Daten einlesen und speichern:
    • Arbeitsverzeichnis in Python festlegen
    • Einlesen und Speichern von CSV- und Excel-Dateien
    • Daten von URLs beziehen
    • Überblick über Parameter
    • Lesen und Schreiben im Python-Format pickle
    • Umgang mit großen Daten
    Datenbankzugriff mit SQLAlchemy:
    • Verbindung zur Datenbank herstellen
    • Tabellen extrahieren/schreiben
    • SQL-Befehle an die Datenbank senden
    • Datenabfragen per SQL-Statement direkt aus Python
    Numpy-Einführung:
    • Einführung in numpy-Arrays und deren Attribute
    • Arrays erstellen und befüllen
    • Mathematische Operationen und Statistikfunktionen
    Datenverarbeitung:
    • Daten normalisieren
    • Fehlende Werte ergänzen
    • Dummy-Variablen und One-Hot-Encoding
    Machine Learning-Überblick:
    • Grundlagen des Machine Learning
    • Praktische Anwendungen
    • Unterschiede von KI, Machine Learning und Deep Learning
    • Überwachtes und unüberwachtes Lernen
    • Vermeidung von Overfitting, Train-Test-Split
    Lineare Regression mit scikit-learn:
    • Aufteilung der Daten, Modellbau und Validierung
    • Grundlagen der linearen Regression
    • Implementierung in Python mit scikit-learn
    • Validierung der Ergebnisse (MSE)
    Logistische Regression mit statsmodels:
    • Verwendung von statsmodels für statistische Modelle
    • Modellbau und Validierung
    • Grundlagen der logistischen Regression
    • Ergebnisvalidierung
    Entscheidungsbaum mit scikit-learn:
    • Datenaufteilung, Modellbau und Validierung
    • Grundlagen des Entscheidungsbaums
    • Implementierung in Python
    • Validierung der Ergebnisse (u.a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
    • Anpassung von Hyperparametern
    Ensemblemethoden (+ AdaBoost):
    • Erstellung und Training von Ensembles mit scikit-learn
    • Bagging und Boosting
    • Grundlagen von AdaBoost für Klassifikation und Regression
    • Implementierung und Validierung
    Random Forest:
    • Datenaufteilung, Modellbau und Validierung
    • Grundlagen des Random-Forest-Algorithmus
    • Validierung der Ergebnisse
    • Out-of-bag error
    • Random Forest für Regression
    • Anpassung von Hyperparametern
    Weitere Algorithmen im Überblick:
    • Einführung in K-nearest Neighbor und einfache neuronale Netzwerke (MLP) mit scikit-learn
    • Implementierung und Validierung
    • Anwendung weiterer Algorithmen mit scikit-learn
    Grid Search & Cross Validation:
    • Kreuzvalidierung und Grid Search mit scikit-learn
    • Automatisierte Suche nach Hyperparametern
    • Training des finalen Modells nach Kreuzvalidierung
    Clustering (K-Means, DBSCAN):
    • Erstellung und Validierung von Cluster-Modellen
    • Grundlagen von K-Means und DBSCAN
    • Implementierung und Validierung
    Abschluss und Fallstudie:
    • Auswahl des geeigneten Algorithmus
    • Visualisierung von Entscheidungsgrenzen
    • Fallstudie zur Wiederholung und Diskussion
Methode

Unser Fokus in der umfangreichen Data Science Weiterbildung liegt auf der praktischen Anwendung. Die Teilnehmer haben die Möglichkeit, eigenständig Übungsaufgaben in Python mit der Entwicklungsumgebung JupyterLab (.ipynb) zu bearbeiten, um die neuen Konzepte besser zu verstehen. Bei auftretenden Fragen oder Unklarheiten steht der Trainer direkt zur Verfügung, um die Teilnehmer zu unterstützen und einen hohen Lernerfolg zu gewährleisten.

Hinweis

Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-Mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.Sie sollten sich in firmenfremde WLAN-Netze registrieren können.Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschaltet ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.Im Seminar wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).Hinweis für Online-Schulungen:Für unsere Online-Schulungen möchten wir Sie darauf hinweisen, dass es von Vorteil ist, wenn Sie über zwei Bildschirme verfügen. Ein zusätzlicher Bildschirm ermöglicht es Ihnen, die Schulungsinhalte auf einem Bildschirm anzuzeigen, während Sie auf dem anderen Bildschirm praktische Übungen durchführen oder Anwendungen parallel öffnen können.Durch die Verwendung von zwei Bildschirmen können Sie die Schulungsinhalte effektiver verfolgen und gleichzeitig interaktiv an den Übungen teilnehmen, ohne zwischen Fenstern hin- und herwechseln zu müssen.Wir empfehlen daher, sich im Vorfeld auf die Schulung mit einem zusätzlichen Bildschirm vorzubereiten, um das bestmögliche Lernerlebnis zu gewährleisten.

Bitte beachten Sie: Seminarsprache ist Deutsch, es werden englische Unterlagen zur Verfügung gestellt.

Weitere Seminare aus dem Bereich Data Science, Machine Learning & KIWeiterführende Informationen: Eine Auswahl vertiefender Inhalte und praxisorientierter Beiträge zum Thema Künstliche Intelligenz findet sich im Blog.Lernziele

Dieses einwöchige Data Science Bootcamp beginnt mit den grundlegenden Konzepten von Python für die Datenanalyse und vermittelt alle erforderlichen Kenntnisse, um am Ende Machine Learning Algorithmen mit scikit-learn zu programmieren. In diesem intensiven Seminar werden die Grundlagen eines Data Scientist erlernt.Die Algorithmen werden theoretisch erklärt, wobei der Schwerpunkt auf der praktischen Umsetzung der Datenanalyse und Algorithmen in Python liegt. Am Ende des Seminars sind die Teilnehmer in der Lage, eigenständig erste Datenanalysen durchzuführen, Machine Learning Algorithmen anzuwenden und die Ergebnisse zu interpretieren.Besonderes Augenmerk wird auf das Paket pandas gelegt, da es in den Bereichen Data Science, Data Engineering und Data Mining Anwendung findet. Die wichtigsten Schritte zur Datenaufbereitung werden geübt. Für die Erstellung von Plots und Grafiken wird das Paket seaborn verwendet, mit einer kurzen Einführung in matplotlib. Matplotlib bietet eine Vielzahl von Anpassungsmöglichkeiten für Plots, während seaborn komplexe Plots mit wenig Code erstellen kann. Es werden auch die Grundlagen von numpy vermittelt, um dieses wichtige Paket im Data Mining einsetzen zu können.Nach einer Einführung in die Grundlagen von Python (Datenstrukturen, Schreiben eigener Funktionen) und einer Erläuterung von pandas für die Datenanalyse folgt der nächste Schritt zur Weiterbildung als Data Scientist: Die Erklärung von Machine Learning Algorithmen und deren Umsetzung in Python mit dem Paket scikit-learn. Dabei werden die bekanntesten Algorithmen (Lineare und logistische Regression, Entscheidungsbaum, Random Forest, SVM, Ensemble Learning, AdaBoost, K-Means, DBSCAN Clustering) behandelt.Nach Abschluss dieser einwöchigen Fortbildung werden die Teilnehmer in der Lage sein, Daten aus verschiedenen Formaten und Datenbanken einzulesen, Daten zu plotten und zu bereinigen sowie Berechnungen durchzuführen. Sie werden die wichtigsten Datentypen in Python kennen, einfache Funktionen schreiben können und das Konzept von Control Flows verstehen. Darüber hinaus werden sie in der Lage sein, Data Wrangling und Data Cleaning mit pandas durchzuführen und Daten für die Umsetzung von Algorithmen mit scikit-learn vorzubereiten.Ein wichtiger Bestandteil des Kurses ist das eigenständige Arbeiten und Lösen von Übungsaufgaben (mit Unterstützung des Dozenten), um das Gelernte direkt in der Praxis umzusetzen und in Python zu programmieren. 

Dieses Seminar ist Teil dieses Qualifizierungsplaners:

Data ScientistZielgruppenDie Weiterbildung zum Data Scientist, die über einen Zeitraum von fünf Tagen stattfindet, richtet sich an Personen, die Interesse daran haben, Python zu erlernen, um Datenanalysen durchzuführen. Neben einer Einführung in Python werden in diesem Kurs auch Grundlagen des Maschinenlernens behandelt.
  • Python-Essentials:
    • Installation von neuen Modulen
    • Jupyter Notebooks / Jupyter Lab
    • Verwendung von Funktionen und Methoden
    • Python im Vergleich zu anderen Sprachen
    Grundlegende Datenstrukturen:
    • Einführun...
Mehr Informationen

Termine und Orte

Datum Preis

SG-Seminar-Nr.: 9197091

Anbieter-Seminar-Nr.: 8LTAFB2YU8

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Inhouse
  • Deutsch
    • Keine
  • Anbieterbewertung   (344)

Ihre Vorteile

mehr erfahren
  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Preis