Skalierbare KI/ML-Infrastrukturen mit NVIDIA Datacenter-GPUs, Kubernetes und OpenShift - Seminar / Kurs von GFU Cyrus AG

Inhalte

  • Skalierbare KI/ML Infrastrukturen - Foundation
    • Skalierbare KI/ML Cluster - Übersicht: zwischen Hype und Realität
    • Welche Unternehmen und Bereiche können von autoskalierbaren KI/ML-Systemen profitieren
    • KI/ML-Cluster-Stack: Architektur und Aufbau von GPU-Accelerated Clustern im Überblick
    • Cloud vs. On-Prem: verfügbare Technologie-Stacks, Aufwand für Setup und Betrieb, Anschaffungs-/Betriebs- Kosten und ROI im Überblick
    • Hybrid-Lösungen für Kosteneffizienz: Pay-per-Use Cloud-Training, sicherer Produktivbetrieb im RZ 
    • Überblick: Involvierte Stacks, Lizenzmodelle und -kosten
  • GPU Accelerated ML Cluster: Core Concepts
    • Architektur und Arbeitsweise von containerisierten GPU Clustern im Detail
    • Datacenter GPUs und Technologien: NVIDIA vs. AMD vs. Intel 
    • Pure TPUs vs. GPUs
    • Infrastruktur: Virtualisiert, Containerisiert - oder besser nicht?
    • Bare Metal vs. VM: Performance vs. IaaS/IaC -Automation und Autoscaling
    • Betrieb von GPUs Nodes in vSphere Enterprise Umgebungen 
    • Hardware-Fragen: NVIDIA Certified Server 
    • Hardware-Fragen: NVIDIA Datacenter GPUs nach Einsatzzweck 
    • NVIDIA MIG-capable Ampere-Cards: Flexibilität und Multi-Tenancy 
    • NVIDIA DGX: Hardware-Komplettlösungen für Unternehmen
    • MIG vs. vGPU Mode
    • Komponenten des NVIDIA AI Enterprise Stacks
  • GPU Accelerated ML Cluster: Advanced Concepts
    • GPU-Nodes in Container-Plattformen: OpenShift vs. Vanilla Kubernetes 
    • IaaS und IaC Best Practices für maximale GPU-Cluster-Automation
    • GPU-Node -Vollautomation mit NVIDIAs GPU-Operator-Stack
    • GPU-Interconnect lokal: NVLink und NVSwitch
    • GPU-Connect remote: GPUDirect RDMA und Network-Operator
    • Überblick: KubeFlow, OpenDataHub und NVIDIAs AI Workspace Operator
    • The Road Ahead 
  • Skalierbare KI/ML Infrastrukturen - Foundation
    • Skalierbare KI/ML Cluster - Übersicht: zwischen Hype und Realität
    • Welche Unternehmen und Bereiche können von autoskalierbaren KI/ML-Systemen profitieren
    • K ...
Mehr Informationen >>

Lernziele

Der Kurs vermittelt wichtige Konzepte und Best Practices rund um Planung, Implementierung und Betrieb von (auto-)skalierbaren KI/ML-Clustern mit NVIDIA Datacenter-GPUs auf Hypervisoren von VMware (vSphere), AWS und GCP, containerisiert mit Kubernetes und OpenShift.  Dabei wird der Fokus auf langfristig planbaren und kosteneffizienten Betrieb mithilfe maximaler Automation (IaaS/IaC/Operatoren) gesetzt. Zudem werden die Vor- und Nachteile der jeweiligen Implementierungsvarianten beleuchtet. Im Rahmen der Schulung kann auch, soweit technisch, zeitlich und thematisch möglich, auf konkrete Problemstellungen der Teilnehmer eingegangen werden.
Der Kurs vermittelt wichtige Konzepte und Best Practices rund um Planung, Implementierung und Betrieb von (auto-)skalierbaren KI/ML-Clustern mit NVIDIA Datacenter-GPUs auf Hypervisoren von VMware (vSph ... Mehr Informationen >>

Zielgruppen

Dieser Kurs richtet sich an Entscheider, Architekten, Projektleiter und Admins/DevOps Teams aus dem Linux-Umfeld, die sich grundlegendes Verständnis über Architektur, Planung und Betrieb von (auto-)skalierbaren NVIDIA GPU-Accelerated Container Clustern (Kubernetes / OpenShift) als Plattform zum Betrieb von KI/ML Systemen aneignen möchten. Der Fokus liegt dabei ausdrücklich auf Operations/Infrastruktur, nicht auf Dev-spezifischen Belangen /ML-Coding. Die Teilnehmer sollten folgende Vorkenntnisse besitzen: 
  • Grundlegende theoretische Vorkenntnisse im Bereich Container/Kubernetes, Virtualisierung und HA-Clustering sind hilfreich, aber nicht zwingend erforderlich.
Dieser Kurs richtet sich an Entscheider, Architekten, Projektleiter und Admins/DevOps Teams aus dem Linux-Umfeld, die sich grundlegendes Verständnis über Architektur, Planung und Betrieb von (auto-)s ... Mehr Informationen >>

Termine und Orte

SG-Seminar-Nr.: 7125925

Anbieter-Seminar-Nr.: 2565

Termine

  • 11.07.2024

    Köln, DE

  • 26.09.2024

    Köln, DE

  • 05.12.2024

    Köln, DE

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Seminar / Kurs
  • Deutsch
    • Zertifikat
  • 7 h
  •  
  • Anbieterbewertung (113)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service