Apache Airflow Einführung und Grundlagen - Seminar / Kurs von GFU Cyrus AG

Inhalte

  • DAGs erstellen - Directed Acyclic Graph
    •  Geheimnisse, Verbindungen und Variablen
    •  Erstellen von Verbindungen beim Starten
    •  Verwendung von Pools für langlaufende und anspruchsvolle Aufgaben
    •  Simulation lang laufender Tasks
    •  DAG-Serialisierung
    •  DAG-Versionierung
    •  Testen von DAGs
    •  CI/CD in Airflow
  • DAGs modularisieren
    •  TaskGroups gegenüber subDAGs
    •  TaskFlowAPI und XComs
    •  Modularisierung
    •  Dynamische und funktionale DAGs
    •  SmartSensors und Zeitüberschreitungen
  • Airflow-Sicherheit
    •  RBAC in Airflow
    •  Einrichten der OAuth-Authentifizierung
    •  Google OAuth hinzufügen
    •  Hinzufügen von SSL-Zertifikaten
    •  Standard-Rollen und benutzerdefinierte Rollen
    •  Erstellen einer benutzerdefinierten Rolle
  • Airflow in Kubernetes
    •  Das Helm-Diagramm
    •  Bereitstellung von Airflow mit Helm
    •  Bereitstellen einzelner Aufgaben in Kubernetes: KubernetesPodOperator
    •  Hinzufügen einer Aufgabe in Kubernetes
    •  Skalierung von Airflow mit Kubernetes-Executor
    •  Ändern der Helm-Diagrammwerte
    •  KEDA-Autoscaler
    •  Vorbereiten von DAGs für Kubernetes
    •  Vollständige Erstellung einer DAG in Kubernetes
Anmerkung: Kubeflow ist sicherlich das modernere Workflow System mit besserer Integration in Kubernetes und Google Cloud. Anwender von Kubeflow berichten allerdings von Differenzen zwischen Beschreibung und Wirklichkeit, siehe: datarevenue.com/de-blog/kubeflow-noch-nicht-bereit-fur-produktion
  • DAGs erstellen - Directed Acyclic Graph
    •  Geheimnisse, Verbindungen und Variablen
    •  Erstellen von Verbindungen beim Starten
    •  Verwendung von Pools für langlaufende und anspruchsvolle Aufgaben
    •  Simula ...
Mehr Informationen >>

Lernziele

Nach dem Seminar wissen Sie: Apache Airflow ist ein wichtiger Scheduler für die programmatische Planung, Erstellung und Überwachung von Workflows in einem Unternehmen. Er ist hauptsächlich für die Orchestrierung und Handhabung komplexer Datenpipelines konzipiert. Apache Airflow hat sich zu einer leistungsstarken Plattform für Datenpipelines entwickelt. 
Nach dem Seminar wissen Sie: Apache Airflow ist ein wichtiger Scheduler für die programmatische Planung, Erstellung und Überwachung von Workflows in einem Unternehmen. Er ist hauptsächlich für die ... Mehr Informationen >>

Zielgruppen

Der Kurs Apache Airflow richtet sich an Data Scientists und Data Engineers, die ihre Workflows in die Produktion bringen wollen. Wenn Sie die besten Praktiken für die Überwachung, Steuerung und Ausführung Ihrer Datenpipelines mit Airflow erlernen möchten,  dann sollten Sie teilnehmen. Grundkenntnisse in Python sind erforderlich.
Der Kurs Apache Airflow richtet sich an Data Scientists und Data Engineers, die ihre Workflows in die Produktion bringen wollen. Wenn Sie die besten Praktiken für die Überwachung, Steuerung und Ausf ... Mehr Informationen >>

Termine und Orte

SG-Seminar-Nr.: 6908634

Anbieter-Seminar-Nr.: 2751

Termine

  • 14.12.2023 - 15.12.2023

    Köln, DE

  • 14.03.2024 - 15.03.2024

    Köln, DE

  • 13.06.2024 - 14.06.2024

    Köln, DE

  • 15.08.2024 - 16.08.2024

    Köln, DE

  • 04.11.2024 - 05.11.2024

    Köln, DE

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Seminar / Kurs
  • Deutsch
    • Zertifikat
  • 14 h
  •  
  • Anbieterbewertung (84)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service