- Grenzen klassischer Datenbanken und Tools
- Neue Anforderungen: Unstrukturierte Daten, Internet of Things, Sensordaten, Echtzeitanalyse
- Gartner 3V (Volume, Velocity, Variety), IBM 4V (Volume, Velocity, Variety, Veracity)
- Real und Near-Real Time Analytics, Streaming, Machine Learning (ML) und Artificial Intelligence (AI)
- Data Warehouse, Grenzen von ETL
- Data Lake Konzepte, ELT, In Memory Analytics
- Big Data Tag Cloud der Assoziationen
Technologien und Anforderungen:
- GRID Konzepte für Massiv Parallel Processing (MPP)
- Verteilte Dateisysteme, DAS, NAS, SAN
- Infrastrukturmanagement: Scale Out vs. Scale Up
- MAP/REDUCE, In Memory Data, Columnar Data Organization
- CAP-Theorem, ACID, BASE
- Replikationsverfahren
- NoSQL und NewSQL
- Big Data und Cloud Computing
- Machine Learning und Deep Learning
Produkte und Herstellerstrategien:
- Apache HADOOP Core, Apache HADOOP Common: HBASE, Hive, Pig, Oozie, Flume, Kafka, Zookeeper etc.
- Beyond HADOOP: Apache Spark - Streaming, Machine Learning, SQL und Graph, Apache Flink
- Kommerzielle HADOOP Distributionen: Hortonworks, Cloudera, MapR, Microsoft HDInsight
- Cloud-Based Services: AWS Lex, IBM Watson, Google Cloud, Microsoft Azure
- Google Tensorflow
- ORACLE, IBM, SAP, SAS, Microsoft
MethodeDer Vortrag des Trainers steht im Vordergrund. Diskussionen untereinander ermöglichen Ihnen, Ihre Erfahrungen auszutauschen und gegenseitig das Wissen zu ergänzen.