Webinar

Big Data II - Praxis-Vertiefung (Live Online Training)

Inhalte

Data Engineering Schulung für moderne Datenpipelines mit Spark, Kafka, dbt und DuckDB
  • Modul 1: Architektur & Modern Data Stack
    • ELT vs. ETL: Paradigmen, die heute zählen
    • Überblick über dlt, dbt, DuckDB, Spark & Kafka
    • Rolle von Storage, Compute und Metadaten
    Modul 2: Daten laden & vorbereiten (Ingestion & Staging)
    • Quellen: APIs, Datenbanken, Flat Files
    • Einsatz von dlt zur Datenaufnahme
    • Versionierung & Change Tracking
    Modul 3: Datenmodellierung & Transformation mit dbt
    • Lakehouse & Medallion Modellierung
    • Datenqualität, Tests & Dokumentation
    • Best Practices für Wiederverwendungsfähigkeit
    Modul 4: Datenanalyse & Exploration mit DuckDB
    • Lokale Query Engines effizient nutzen
    • Performancevorteile gegenüber klassischen Tools
    • Analysepipeline entwickeln
    Modul 5: Skalierung & Betrieb
    • Batch-Verarbeitung mit Apache Spark
    • Streaming mit Apache Kafka
    • Performance, Monitoring & Kostenoptimierung
    Modul 6: Stabiler Betrieb & Takeaways
    • Pipeline-Orchestrierung und Deployment
    • Logging, Alerting & Fehlermanagement
    • Best Practices & Transfer in den eigenen Kontext
Methode

Das Seminar kombiniert Hands-on Labs, Live Coding, Mini-Projekte, technische Impulse, Diskussion realer Anwendungsfälle sowie Best Practices und Troubleshooting-Sessions.Der Fokus liegt klar auf praktischer Umsetzung: Die Teilnehmenden arbeiten mit vorbereiteten Übungen, realitätsnahen Daten und nachvollziehbaren Patterns. Dadurch entsteht eine direkte Verbindung zwischen Schulungsinhalten und typischen Anforderungen aus Data-Engineering-Projekten.

LernzieleDieses Big Data Training zeigt Ihnen, wie moderne Datenplattformen praktisch aufgebaut, erweitert und betrieben werden. Im Mittelpunkt steht die Umsetzung realer Datenpipelines: Sie laden Daten aus verschiedenen Quellen, transformieren und modellieren diese strukturiert und lernen, wie Daten zuverlässig, skalierbar und nachvollziehbar bereitgestellt werden.In dieser Data Engineering Schulung arbeiten Sie mit aktuellen Werkzeugen wie dlt, dbt, DuckDB, Apache Spark und Apache Kafka. Sie lernen, wie moderne ELT-Workflows entstehen, wie Datenqualität sichergestellt wird und wie sich Batch- und Streaming-Prozesse in einer produktionsnahen Umgebung verbinden lassen.Das Seminar legt den Fokus auf praktische Handlungsfähigkeit. Sie arbeiten mit realistischen Musterdaten, entwickeln End-to-End-Datenpipelines und erhalten Vorlagen, Patterns und Best Practices, die Sie auf eigene Projekte übertragen können.Ihre Vorteile / NutzenFür Teilnehmende:Sie können moderne Datenpipelines eigenständig planen, entwickeln, testen und stabil betreiben. Sie gewinnen Sicherheit im Umgang mit wichtigen Data-Engineering-Tools und verstehen, wie Spark, Kafka, dbt, DuckDB und dlt in realen Datenplattformen zusammenspielen.Für Unternehmen:Unternehmen profitieren von skalierbaren, wartbaren und effizient betriebenen Datenprozessen. Dadurch entsteht eine verlässliche Grundlage für Analytics, Reporting, KI-Anwendungen und datenbasierte Produkte.Dieses Seminar eignet sich für alle, die Big Data praktisch anwenden und moderne Datenpipelines selbst entwickeln möchten.Jetzt Platz sichern und teilnehmen.SeminarzielSie entwickeln die Fähigkeit, moderne Datenpipelines eigenständig zu planen, zu implementieren und zu betreiben. Dabei verbinden Sie Data Engineering Best Practices mit praktischer Umsetzung in den Bereichen Datenaufnahme, Transformation, Datenqualität, Batch-Verarbeitung, Streaming und Performanceoptimierung.Lernziele – Sie lernen:
  • Daten aus APIs, Datenbanken und Dateien strukturiert zu laden, zu transformieren und aufzubereiten. 
  • Moderne ETL- und ELT-Workflows zu entwerfen und in Data-Engineering-Projekten umzusetzen. 
  • dlt für Data Ingestion, Schema Evolution und inkrementelles Laden einzusetzen. 
  • dbt für Datenmodellierung, Tests, Dokumentation und Data Quality zu nutzen. 
  • DuckDB für lokale Analytics, schnelle Datenexploration und OLAP-Szenarien einzusetzen. 
  • Apache Spark für verteilte Batch-Verarbeitung zu verwenden und Performanceprobleme zu erkennen. 
  • Apache Kafka für Event Streaming und Echtzeit-Datenpipelines zu konfigurieren. 
  • Datenpipelines zu überwachen, zu testen und produktionsnah zu betreiben. 
  • Performance- und Kostenfaktoren in Datenplattformen zu bewerten. 
  • Best Practices für stabile, wartbare und nachvollziehbare Datenpipelines anzuwenden.
KompetenzenDas Seminar stärkt Ihre technisch-operative Kompetenz im Data Engineering. Sie bauen praktische Fähigkeiten im Umgang mit Datenpipelines, ELT-Workflows, Datenmodellierung, Spark, Kafka, dbt und DuckDB auf.Gleichzeitig entwickeln Sie ein systematisches Architekturverständnis und stärken Ihre praktische Entscheidungsfähigkeit beim Aufbau datengetriebener Prozesse. Dazu gehören auch analytisches Denken, Fehlersuche, Qualitätsbewusstsein und der strukturierte Transfer in reale Projekte.ZielgruppenDas Seminar richtet sich an Data Engineers, Data Scientists, Softwareentwickler:innen, Analytics Engineers sowie technisch affine Anwender:innen, die bereits Grundlagen im Big-Data-Umfeld besitzen und nun praxisorientierte Umsetzungskompetenz aufbauen möchten.Besonders geeignet ist das Training für Teams, die Datenpipeline-Prozesse professionalisieren, Data-Engineering-Kompetenz aufbauen oder moderne Tools wie Spark, Kafka, dbt und DuckDB in der Praxis kennenlernen möchten.
Data Engineering Schulung für moderne Datenpipelines mit Spark, Kafka, dbt und DuckDB
  • Modul 1: Architektur & Modern Data Stack
    • ELT vs. ETL: Paradigmen, die heute zählen
    • Überblick über dlt, dbt, DuckDB, ...
Mehr Informationen

Termine und Orte

Datum Dauer Preis
Webinar
08.10.2026 - 09.10.2026 12 h 12 h Details Details Jetzt buchen
10.12.2026 - 11.12.2026 12 h 12 h Details Details Jetzt buchen

SG-Seminar-Nr.: 9390608

Anbieter-Seminar-Nr.: 54602(Live Online Training)

Termine

  • 08.10.2026 - 09.10.2026

    Webinar

  • 10.12.2026 - 11.12.2026

    Webinar

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Seminar merken
Vergleichen
Jetzt buchen

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Webinar
  • Deutsch
    • Keine
  • 12 h
  • Anbieterbewertung   (343)

Ihre Vorteile

mehr erfahren
  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Dauer Preis
Webinar
08.10.2026 - 09.10.2026 12 h 12 h Details Details Jetzt buchen
10.12.2026 - 11.12.2026 12 h 12 h Details Details Jetzt buchen