Spark für Big Data - Training / Workshop von Thinkport GmbH

Meistern Sie Datenanalyse mit Text Mining und Machine Learning Methoden. Anhand eines Real-World Use Case lernen Sie Spark als Big Data Analyse Tool kennen.

Inhalte

Einer der nachgefragtesten Skillsets zu Zeiten von Big Data ist die Fähigkeit große Datenmengen zu analysieren. In diesem interaktiven Kurs vermittelt Thinkport die notwendigen Grundlagen, um eigenständig mit Apache Spark Datenauswertungen durchführen zu können.

Dabei werden anhand eines praxisorientierten Projekts sowohl Apache Spark Streaming als auch Machine Learning Konzepte vertieft. Darüber hinaus gewährt dieser Cloud Excellence Workshop einen Einblick in diverse Schlüsselkonzepte der Cloudplattform Microsoft Azure.

Grundlagen Tag I:

  • Überblick: Was ist Big Data
  • Spark Grundlagen I: RDD
  • Lab: Anwendung von Dataframes
  • Überblick: Microsoft Azure
  • Python Crashkurs (optional)

Streaming Tag II:

  • Überblick: Was ist Streaming
  • Spark Grundlagen II: Spark Streaming
  • Day-Lab: Twitter Streaming mit Spark (Datenabzug, Auswertung mit Spark Streaming, Speichern in einem Datalake, und Erstellen einer Data Pipeline)

Text Mining Tag III:

  • Überblick: Machine Learning und Text Mining
  • Machine Learning mit MLlib
  • Day-Lab: Text Mining mit Machine Learning Modellen (Regression, Random Forest), Tokenization und Sentimentanalysis

 

Lernziele

Die Teilnehmer können nach Abschluss:

  • Große Datensätze und -mengen mit Apache Spark analysieren
  • Mit Apache Spark Streaming Daten in Echtzeit sammeln und analysieren (Hands-on Projekt: Twitter Daten)
  • Anhand von Text Mining und Machine Learning Methoden Daten auswerten (Hands-on Projekt: Twitter Daten)
  • Eine Plattform für automatische Analysen in Microsoft Azure bauen

Zielgruppen

Der Kurs ist geeignet für Personen mit:

  • Grundkenntnissen in Python und dem Willen diese im Bezug auf Big Data zu vertiefen
  • Erfahrungen in einer anderen Programmiersprache und Interesse Apache Spark kennenzulernen

Termine und Orte

Datum Uhrzeit Dauer Preis
Online, DE
22.06.2021 - 24.06.2021 09:00 - 17:30 Uhr 24 h Jetzt buchen ›

SG-Seminar-Nr.: 5743212

Termine

  • 22.06.2021 - 24.06.2021

    Online, DE

Preise inkl. MwSt. Es können Gebühren anfallen. Für eine exakte Preisauskunft wählen Sie bitte einen Termin aus.

Jetzt buchen ›
Seminar merken ›

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Über Semigator mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Uhrzeit Dauer Preis
Online, DE
22.06.2021 - 24.06.2021 09:00 - 17:30 Uhr 24 h Jetzt buchen ›