- DAGs erstellen - Directed Acyclic Graph
- Geheimnisse, Verbindungen und Variablen
- Erstellen von Verbindungen beim Starten
- Verwendung von Pools für langlaufende und anspruchsvolle Aufgaben
- Simulation lang laufender Tasks
- DAG-Serialisierung
- DAG-Versionierung
- Testen von DAGs
- CI/CD in Airflow
- DAGs modularisieren
- TaskGroups gegenüber subDAGs
- TaskFlowAPI und XComs
- Modularisierung
- Dynamische und funktionale DAGs
- SmartSensors und Zeitüberschreitungen
- Airflow-Sicherheit
- RBAC in Airflow
- Einrichten der OAuth-Authentifizierung
- Google OAuth hinzufügen
- Hinzufügen von SSL-Zertifikaten
- Standard-Rollen und benutzerdefinierte Rollen
- Erstellen einer benutzerdefinierten Rolle
- Airflow in Kubernetes
- Das Helm-Diagramm
- Bereitstellung von Airflow mit Helm
- Bereitstellen einzelner Aufgaben in Kubernetes: KubernetesPodOperator
- Hinzufügen einer Aufgabe in Kubernetes
- Skalierung von Airflow mit Kubernetes-Executor
- Ändern der Helm-Diagrammwerte
- KEDA-Autoscaler
- Vorbereiten von DAGs für Kubernetes
- Vollständige Erstellung einer DAG in Kubernetes
Anmerkung: Kubeflow ist sicherlich das modernere Workflow System mit besserer Integration in Kubernetes und Google Cloud. Anwender von Kubeflow berichten allerdings von Differenzen zwischen Beschreibung und Wirklichkeit, siehe:
datarevenue.com/de-blog/kubeflow-noch-nicht-bereit-fur-produktion