1. Tag: Einführung in die Datenwissenschaft für datengetriebene Entscheidungen
Sie lernen, wie man wirtschaftliche Fragestellungen in ein Modellierungsproblem umwandelt. Wir starten dazu mit realen Daten und bereiten diese für die Modellierung vor.
- Einsatz von maschinellem Lernen für Geschäftszwecke
- Churn Prediction
- Prevention
- Ad Click Predictions
- Recommender Systems
- Image Recognition
- Fraud and Risk Detection
- Dynamic Pricing Calculations
- Sports Analytics
- Engagement Increase
- Predictive Demand
- Neue Kreditvergabemodelle
- Von wirtschaftlichen Fragestellungen zum Model
- Praxis: Arbeit mit Daten
- Datensäuberung
- Behandlung fehlender Werte
- Ausreißer
- Verteilungen
- Datentransformation
- Selektion von Merkmalen
- Dimensionsreduzierung (Principal Component Analysis, PCA)
- Erste Modellierung mit ausgewähltem Klassifikator
2. Tag: Von Modellierungsalgorithmen bis hin zur Optimierung
Sie bekommen einen Überblick über verschiedene Algorithmen, die für die Modellierung verwendet werden können. Es wird gezeigt, wie das Ergebnis der Modellierung durch Parametertuning verbessert werden kann. Des Weiteren wird im Detail gezeigt, wie man eine passende Auswertungsmetrik wählt, die der Lösung der Fragestellung am besten entspricht.
- Überblick über Modellierungsalgorithmen
- Klassifizierung
- Clustering
- Regression
- Praxis: Auswertung der Performance verschiedener Algorithmen mit den
- Daten vom ersten Tag
- Deep Learning
- Auswertung der Metriken und welche Metrik für welche Probleme eingesetzt werden sollte
- Accuracy (Genauigkeit)
- ROC (Receiver-Operating-Characteristic-Kurve bzw.
- Grenzwertoptimierungskurve)
- AUC (Area under the curve)
- Precision
- Recall
- Confusion Matrix (Wahrheitsmatrix)
- Cross Validation (Kreuzvalidierungsverfahren)
- Feature Engineering
- Praxis: Mit Daten vom ersten Tag wählen wir die am besten geeignete Metrik für das Problem aus, suchen das am besten passende Model aus und nutzen Cross Validation für die finale Modellierung. Damit lässt sich die Frage beantworten, was die maximal-beste Performance des Modells ist, das erzielt werden konnte.
- Diskussion
1. Tag: Einführung in die Datenwissenschaft für datengetriebene Entscheidungen
Sie lernen, wie man wirtschaftliche Fragestellungen in ein Modellierungsproblem umwandelt. Wir starten dazu mit realen ...
Mehr Informationen >>