1. Teil: Grundlagen Themen (1.-2. Tag)
- Überblick Teil 1
- Business Szenario
- Analytics Taxonomie & Hierarchie
- Standards: CRISP-DM & Collaborative CRISP
- Data Science in Unternehmen
- Einstieg in RapidMiner Studio
- Benutzungsoberfläche
- Erstellen und Verwalten von RapidMiner Repositories
- Operatoren und Prozesse
- Speichern von Daten, Prozessen und Ergebnisse
- Explorative Datenanalyse
- Daten Laden
- Schnelle Statistik erstellen
- Daten visualisieren & Charts erstellen
- Daten aufbereiten
- Grundlagen von Daten ETL (Extrahieren, Transformieren, Laden)
- Datentypen & Umwandlungen von Typen
- Umgang mit fehlenden Werten
- Umgang mit Attributrollen
- Filtern von Zeilen und Spalten
- Normalisieren und Standardisieren
- Bessere Prozesse bauen
- Organisation, Umbenennen & Relative Pfade
- Sub-Prozesse verwenden
- Building Blocks
- Breakpoints
- Predictive Modelling Algorithmen
- k-Nearest Neighbor
- Naive Bayes
- Lineare Regression
- Entscheidungsbäume und -regeln
- Modelle erstellen und evaluieren
- Machine Learning Theorie: Bias, Varianz, Overfitting & Underfitting
- Splitting Data
- Split- und Cross-Validation
- Evaluationsmethoden & Gütekriterien
- Optimierung und Parameter Tuning
- Modelle anwenden
- Zusätzliche Workshops
- Ausreißer-Detektion
- Random Forest
- Ensemblesmethoden
2. Teil: Fortgeschrittene Themen (3.-4. Tag)
- Überblick Teil 2
- Business Szenario
- Intro Kurs Review
- Laden neuer Daten
- Explorative Datenanalyse
- Multiple Datenquellen
- Joins & Set Theorie
- Neue Attribute verstehen
- Daten aufbereiten
- Fortgeschrittene Methoden für Daten EDL (Extrahieren, Transformieren, Laden)
- Aggregation & Multi-Level Aggregation
- Pivot & De-Pivot
- Kalkulierte Werte
- Reguläre Ausdrücke (Regex)
- Verändern von Wertetypen
- Feature Generierung und Bearbeitung
- Schleifen
- Macros
- Predictive Modelling Algorithmen
- Support Vector Machines (SVM)
- Neuronale Netze
- Logistische Regression
- Modelle erstellen und evaluieren
- Fortgeschrittene Gütekriterien
- ROC Plots
- Vergleichen von Modellen
- Sampling
- Weighting
- Feature Selection: Forward Selection
- Feature Selection: Backward Elimination
- Validierung von Preprocessing und Preprocessing Modellen
- Optimierung von Parametern & Ergebnisse Loggen
- Zusätzliche Workshops
- Hauptkomponentenanalyse
- Logistische Regression
- Kostenmatrix und Modelloptimierung
1. Teil: Grundlagen Themen (1.-2. Tag)
- Überblick Teil 1
- Business Szenario
- Analytics Taxonomie & Hierarchie
- Standards: CRISP-DM & Collaborative CRISP
- Data Science in Unternehmen
- Einstieg in RapidMi ...
Mehr Informationen >>