Webinar

Databricks Komplett - Foundation & Advanced

Empfehlen Frage stellen Inhouse anfragen Drucken/ PDF

Inhalte

Tag 1: Theorie und Grundarchitektur - Lakehouse Platform & Data Governance

Teil 1: Theorie, Grundlagen und Einordnung
- Rolle von DataOps, Data Engineering und Data Analytics in modernen Datenökosystemen
- Überblick Databricks Lakehouse: zentrale Konzepte, Architektur und Workflow
- Aufbau einer Medaillon-Architektur (Bronze -> Silber -> Gold)
- Einordnung von Data Mesh, Data Products und Data Fabric
- Spark-Grundlagen: Cluster, Runtimes, Execution Model
- Delta Lake: ACID, Versionierung, Time Travel, Performance-Optimierung
Teil 2: Grundarchitektur - Lakehouse Plattform & Data Governance
- Databricks Workspaces, Cluster-Typen (Classic Compute vs. Serverless), SQL Warehouses
- Unity Catalog: Data Governance, Berechtigungen, Data Lineage, Data Discovery
- Databricks One: Integration von Databricks AI/BI Dashboards und Databricks Genie
- Cloud-Integration (AWS / Azure): Landing Zones, Networking, Storage-Anbindung
- Sicherheitsmodelle: Rollen, Berechtigungen, Secrets, Verschlüsselung

Tag 2: Ingestion & Intergration, Transformation & Pipelines

Teil 3: Daten kommen an - Ingestion & Integration
- Anbindung von Datenquellen: Datenbanken, Cloud-Storages, APIs, Streaming
- Ingestion-Strategien: Batch, Streaming, Auto Loader, Partner Connect
- Aufbau von Landing Zones für strukturierte & unstrukturierte Daten (z. B. SAP / Non-SAP)
- Best Practices zur zuverlässigen Datenübernahme (DataOps-Ansätze)
Teil 4: Daten werden verarbeitet - Transformation & Pipelines
- Arbeiten mit Notebooks (Python, SQL, Spark)
- Aufbau von ETL/ELT-Pipelines mit Spark Declarative Pipelines (Databricks Pipelines & Jobs)
- DataOps-Prinzipien: CI/CD, Git-Integration, Reproduzierbarkeit
- Optimierung von Pipelines und Clustern

Tag 3: Data Products & Sharing, Analytics & Reporting

Teil 5: Bereitstellung der Daten - Data Products & Sharing
- Umsetzung der Medaillon-Stufen (Bronze -> Silber -> Gold)
- Aufbau produktionsreifer Data Products
- Delta Sharing: interne und externe Datenbereitstellung
- Data Governance mit dem Databricks Unity Catalog
- Databricks Asset Bundles: strukturierte Blueprints für Data Products & Use Cases
Teil 6: Auswertung der Daten - Analytics & Reporting
- Analytische Abfragen mit Databricks SQL
- Erstellung von Databricks AI/BI Dashboards und Reports
- Integration von BI-Tools (am Beispiel von Power BI)
- Skalierungsstrategien für Analyse-Workloads
- Typische Use Cases: Standarding Reporting, Self-Service BI und Ad-hoc-Analysen

Tag 4: Deep Dive Databricks Plattform & Performance

Teil 1: Advanced Spark & Performance Tuning
- Analyse des Spark Execution Models in Databricks
- Optimierung von DataFrame- und SQL-Operationen
- Umgang mit Skew, Shuffle, Partitioning, Caching und Z-Order
- Nutzung des Databricks UIs für Fehleranalysen und Performance-Debugging
- Best Practices für skalierbare ETL/ELT-Pipelines
Teil 2: Cluster Tuning & Ressourceneffizienz
- Vergleich von Cluster-Typen (Classic Compute, Serverless, Jobs-Clusters)
- Cluster Policies, Pools und Optimierungsstrategien
- Auto-Scaling korrekt konfigurieren und Monitoring sinnvoll nutzen
- Kostenkontrolle und FinOps-Praktiken im Umgang mit Databricks Lakehouse Architekturen
Teil 3: Databricks Unity Catalog - Expertenfunktionen
- Erweiterte Governance-Konzepte mit dem Unity Catalog
- Arbeiten mit Metadaten, Data Lineage und Automatisierungsansätzen
- Feingranulare Berechtigungsverwaltung
- Umgang mit Primary Keys und Foreign Keys in Tabellen
- Erweiterte Delta-Funktionen: Optimize, Vacuum, Constraints, Expectations

Tag 5: Enterprise Features, Automation & GenAI

Teil 4: Fortgeschrittene DataOps & Automatisierung
- Infrastrukturautomatisierung: Asset Bundles, CI/CD, Git-Workflows
- Abgrenzung: Terraform vs. Databricks Asset Bundles vs. Databricks Python SDK
- Jobs, Workflows und Pipelines für Enterprise DataOps
- Fehleranalyse und Monitoring für produktive Pipelines
- Deployment-Strategien für Data Products
Teil 5: Enterprise Data Management & Data Quality
- Data Quality Patterns (z. B. Funnels, Wrangling-Prozesse) mit Delta Live Tables und Databricks AI/BI Dashboards
- Professioneller Einsatz von Constraints, Checks & Expectations
- Enterprise Metadatenmanagement und Katalogisierung
- Data Labeling im Kontext moderner Governance
Teil 6: GenAI & Databricks Genie
- Optimierung von Tabellen-, Spalten- und Schema-Beschreibungen im Unity Catalog für präzise GenAI-Generierung
- Einsatz klarer Metadaten, damit Genie natürliche Sprache korrekt in SQL und Strukturvorschläge übersetzen kann
- Definition von Relationen, Constraints und Data Contracts zur besseren Orientierung für Genie
- Best Practices für konsistente Dokumentation, um Genies Query- und Code-Assistenz gezielt zu unterstützen
Teil 7: Enterprise Sharing & Collaboration
- Erweiterte Nutzung von Delta Sharing (intern/extern)
- Best Practices für sichere Datenbereitstellungen

LernzieleNach diesen fünf Tagen verfügen Sie über ein ganzheitliches und tiefgehendes Verständnis der Databricks Lakehouse Plattform. Sie können Data Pipelines konzipieren, implementieren und optimieren, Governance-Modelle professionell umsetzen, Cluster effizient konfigurieren und Enterprise-Architekturen skalierbar betreiben. Sie verbinden Foundation-Wissen mit Advanced-Techniken und agieren sicher in produktiven Cloud-Umgebungen auf AWS oder Azure.ZielgruppenDieses Seminar richtet sich an Data Engineers, DataOps Engineers, Analytics Engineers, BI-Professionals und Cloud-Architekten, die Databricks umfassend beherrschen möchten. Sie arbeiten bereits mit Databricks oder planen den strategischen Aufbau einer Lakehouse-Architektur. Sie benötigen solide Kenntnisse in SQL und Spark sowie praktische Erfahrung mit Datenpipelines oder Cloud-Plattformen. Das Seminar kombiniert Foundation- und Advanced-Level und ist als intensives Praxis- und Architekturtraining konzipiert.

Tag 1: Theorie und Grundarchitektur - Lakehouse Platform & Data Governance

Teil 1: Theorie, Grundlagen und Einordnung
- Rolle von DataOps, Data Engineering und Data Analytics in modernen Datenökosysteme...

Mehr Informationen

Termine und Orte

Datum	Dauer
Webinar
02.11.2026 - 06.11.2026 35 h	35 h	Details	Details Jetzt buchen
11.01.2027 - 15.01.2027 35 h	35 h	Details	Details Jetzt buchen
10.05.2027 - 14.05.2027 35 h	35 h	Details	Details Jetzt buchen
23.08.2027 - 27.08.2027 35 h	35 h	Details	Details Jetzt buchen
22.11.2027 - 26.11.2027 35 h	35 h	Details	Details Jetzt buchen

SG-Seminar-Nr.: 9267300

Anbieter-Seminar-Nr.: 6213

Termin

23.08.2027 - 27.08.2027

Online

4 weitere Termine

Günstige Preise

€ 4.486,30

Alle Preise inkl. 19% MwSt.

Jetzt buchen

Seminar merken

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

Webinar
Deutsch
- Keine
35 h
Anbieterbewertung (258)

Ihre Vorteile

mehr erfahren

Anbietervergleich von über 1.500 Seminaranbietern
Vollständige Veranstaltungsinformationen
Schnellbuchung
Persönlicher Service

Datum	Dauer
Webinar
02.11.2026 - 06.11.2026 35 h	35 h	Details	Details Jetzt buchen
11.01.2027 - 15.01.2027 35 h	35 h	Details	Details Jetzt buchen
10.05.2027 - 14.05.2027 35 h	35 h	Details	Details Jetzt buchen
23.08.2027 - 27.08.2027 35 h	35 h	Details	Details Jetzt buchen
22.11.2027 - 26.11.2027 35 h	35 h	Details	Details Jetzt buchen

Abbrechen