Grundlagen des Maschinellen Lernens mit scikit-learn und Python- Grundlegende Einblicke in das Feld des Maschinellen Lernens:
- Einführung in das Gebiet des Maschinellen Lernens
- Erläuterung der Unterschiede zwischen überwachtem und unüberwachtem Lernen
- Überwindung von Overfitting durch kluge Datasplitting-Strategien (Training vs. Testdaten)
Basiswissen zur Linearen Regression:
- Verständnis für den Linearen Regressionsalgorithmus aufbauen
- Richtige Aufteilung von Daten in Training und Test
- Praktische Umsetzung der Linearen Regression in Python (mit scikit-learn)
- Solide Überprüfung der Ergebnisse
Eintauchen in die Logistische Regression (unter Nutzung von StatsModels):
- Aufbau des Verständnisses für die Logistische Regression (Entwicklung von linear zu logistisch)
- Sorgfältige Datenaufteilung für Training und Test
- Implementierung der Logistischen Regression in Python
- Kritische Prüfung und Bewertung der Ergebnisse und des Modells (AIC, BIC, Konfusionsmatrix)
- Erläuterung der Koeffizienteninterpretation (Odds-Ratio)
- Roc Curve und Fläche unter der Kurve (AUC) im Fokus
Tiefere Einblicke in den Entscheidungsbaum-Algorithmus:
- Verständnis für den Entscheidungsbaum-Algorithmus entwickeln
- Richtige Aufteilung von Daten in Training und Test
- Konkrete Umsetzung des Entscheidungsbaums in Python (mit scikit-learn)
- Feintuning der Hyperparameter für optimale Leistung
- Sorgfältige Validierung der Ergebnisse (Konfusionsmatrix, Genauigkeit)
- Anwendung des Entscheidungsbaums für Regressionsszenarien
Ensemble-Methoden und ihre Effektivität:
- Ein Ensemble aus verschiedenen Algorithmen mit scikit-learn realisieren
- Random Forest für Klassifikation und Regression nutzen
- Einsatz von Ada Boost für Klassifikation und Regression verstehen
- Feintuning der Hyperparameter für optimierte Ergebnisse
- Akkurate Bewertung der Modellleistung durch gezielte Validierung
Erkundung weiterer Schlüsselalgorithmen:
- K-Nearest Neighbor-Verfahren beleuchten
- Einfaches Neuronales Netz (Multi-Layer Perceptron, MLP) betrachten
- Direkte Umsetzung der Algorithmen in Python
- Gründliche Ergebnisüberprüfung und -bewertung
Optimierung von Hyperparametern und Anwendung von Kreuzvalidierung:
- Automatisierte Suche nach optimalen Hyperparametern
- Kreuzvalidierung (Cross-Validation) als Schlüssel zur Modellbewertung
- Umsetzung dieser Konzepte in scikit-learn
Erkundung von Clustering-Algorithmen:
- Basisverständnis für K-Means Clustering und DBScan erlangen
- Interpretation der Ergebnisse von Clustering-Vorgängen
- Vergleich der Ergebnisse verschiedener Clustering-Methoden
MethodeDas Seminar kombiniert kurze theoretische Impulse mit Live-Demonstrationen in Python mit umfangreichen Hands-on-Übungen. Die Teilnehmer:innen arbeiten direkt in JupyterLab und wenden die Methoden auf realitätsnahe Datensätze an. Die Trainer:innen demonstrieren die Vorgehensweise live, begleiten Sie bei der Bearbeitung der Aufgaben und geben Feedback zu Ihren Lösungen.
LernzieleMachine Learning ist ein zentrales Werkzeug moderner Datenanalyse – und gewinnt in nahezu allen Branchen an Bedeutung. In diesem zweitägigen Seminar lernen Sie, wie Sie mit der Programmiersprache Python und der Bibliothek scikit-learn praxisnah Machine-Learning-Modelle entwickeln. Der Fokus liegt auf überwachten Lernverfahren wie linearer und logistischer Regression, Entscheidungsbäumen, Random Forests sowie neuronalen Netzen. Auch Methoden des unüberwachten Lernens wie K-Means und DBSCAN werden behandelt. Sie arbeiten dabei aktiv in JupyterLab und vertiefen Ihr Wissen durch zahlreiche Übungen.Das Seminar findet wahlweise als Präsenzseminar oder als Live Online Training statt und verbindet theoretische Grundlagen des Machine Learning mit umfangreichen praktischen Übungen in Python.Nach dem Seminar sind Sie in der Lage, Machine-Learning-Algorithmen selbstständig anzuwenden, Modelle zu bewerten und Ihre Python-Kenntnisse gezielt für datengetriebene Aufgaben einzusetzen. Sie schaffen damit eine fundierte Grundlage für weiterführende Anwendungen im Bereich Data Science.
Dieses Seminar ist Teil dieses Qualifizierungsplaners:
Data Scientist
Zielgruppen
- Die Schulung richtet sich an Fachkräfte wie Data Scientists, angehende Machine Learning Engineers, Datenanalystinnen und -analysten, Business Intelligence sowie und Data Analystinnen und Analysten, die ihre Python-Kenntnisse im Bereich Data Science und Data Mining vertiefen möchten.
- Besonders geeignet für Personen, die bereits über grundlegende Programmierkenntnisse in Python verfügen und diese erweitern wollen, um Machine Learning mit scikit-learn eigenständig umzusetzen.