Apache Spark für Entwickler (DE) - Training / Workshop von Trivadis Holding AG

Inhalte

Du hast vor ein Projekt mit Apache Spark zu starten, oder bist neugierig auf diese flexible und leistungsstarke Plattform? Wir stellen dir die Architektur mit ihren einzelnen Komponenten und deren Anwendung vor. Erlernt wird der Einsatz von Apache Spark auf unterschiedlichen Daten. In Übungen wird der Teilnehmer die Verarbeitung und Analyse unstrukturierter und strukturierter Daten aus Dateien sowie Datastores direkt anwenden; dies unter Einsatz von spezialisierten OpenSource-Entwicklungs- und Analysewerkzeugen wie Apache Zeppelin. Wir vermitteln die Adhoc-Analyse ebenso wie die Entwicklung der Datenbereitstellung/Integration für Streaming und Batchverarbeitung praxisorientiert. Best Practices und Tipps aus der Praxis geben dem Teilnehmer das Rüstzeug für einen erfolgreichen Start mit Apache Spark.

Contents
  • Einführung in die Programmiersprache Scala
  • Einführung in Apache Spark
  • Spark Core
  • Spark SQL mit DataFrame und DataSet
  • Spark Streaming und Spark Structured Streaming
  • Integration eines Datastores
  • Deployment und Monitoring
  • Performance Tipps
  • Tooling
Methode
  • Vortrag und Diskussionen
  • Übungen auf virtuellen Maschinen
  • Best-Practices und Erfahrungen von unseren Referenten aus dem Kundeneinsatz
Requirements
  • Grundkenntnisse des Hadoop-Ökosystems (Architektur, MapReduce, HDFS, YARN)
  • Grundkenntnisse in objektorientierter und funktionaler Programmierung
  • Grundkenntnisse in Java oder Python
  • Laptop mit mindestens vier CPU Cores und 16 GB RAM sowie VMWare Player oder Virtualbox installiert

Lernziele

Nach unserem Apache Spark-Kurs …

  • verstehst du die Architektur von Apache Spark und deren Funktionsweise
  • kannst du unstrukturierte sowie strukturierte Daten aus unterschiedlichen Quellen einlesen und schreiben
  • verarbeitest du Daten mittels der Programmiersprache Scala
  • weisst du, wie du unstrukturierte Daten mittels Spark strukturieren kannst
  • wertest du die Daten mit Apache Zeppelin aus
  • kannst du Streaming-Daten einbinden, strukturieren und auswerten
  • hast du die Fähigkeit, performanceoptimierte Spark Programme zu erstellen

Zielgruppen

  • Entwickler
  • System-Architekten
  • Berater
  • Big Data Interessierte

SG-Seminar-Nr.: 5193192

Anbieter-Seminar-Nr.: S-SPARK (DE)

Preis jetzt anfragen

Seminar merken ›

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Über Semigator mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service