Webinar

Generative KI Masterclass: Ein eigenes LLM bauen und trainieren

Inhalte

Tag 1: Deep Dive - Architektur & Daten 1. Eigene LLM-Architektur
  • Transformer intern (Self-Attention, Multi-Head, Position Embeddings)
  • GPT-Style Decoder vs. Encoder-Decoder (T5, BART)
  • 2. Datenauswahl & Aufbereitung
  • Öffentliche Datensätze (The Pile, Books3, OpenWebText2)
  • Copyright & Cleanup (Duplikate, Filters)
  • Geschlossene/unternehmensinterne Daten (Datenschutz)
  • 3. Tokenisierung
  • Byte Pair Encoding (BPE), SentencePiece, ttoken
  • Vocabulary-Größe, Trade-offs
  • 4. Hands-on:
  • Erstes Skript: Tokenizer-Training auf einem Mini-Korpus
  • Großer Korpus? Wie man ihn vorbereitet (Chunking, Sharding, etc.)
Tag 2: Implementierung & Training-Pipeline
  • 1. Implementierung eines Mini-Transformers
    • PyTorch oder TensorFlow: Layer (Attention, Feedforward), GPTBlock / DecoderLayer
    • Konfigurationsparameter (Hidden Dim, Heads, Depth)
  • 2. Training-Setup
    • GPU/TPU-Einrichtung (lokal vs. Cloud)
    • Batch Size, Lernrate, Optimizer (AdamW)
    • Mixed Precision (FP16/BF16)
  • 3. MLOps-Tools
    • MLflow, ClearML oder Weights & Biases zum Tracken von Experimenten
  • 4. Hands-on:
    • Starte ein Trainingsskript für einen kleinen Datensatz (z. B. 50-100 MB Text)
    • Protokolliere Training Loss, evaluiere gelegentliche Samples
Tag 3: Feintuning, Evaluierung & RAG
  • 1. Weiterführendes Training
    • Feintuning vs. Training-from-scratch
    • RLHF (Reinforcement Learning from Human Feedback) - theoretischer Überblick
  • 2. Evaluierung
    • Perplexity, Token-Accuracy
    • Generische Metriken: BLEU, ROUGE, etc.
  • 3. Retrieval-Augmented Generation
    • Eigene RAG-Pipeline auf selbst trainiertem Modell?
    • Einbinden einer Vektordatenbank (Chroma, FAISS)
  • 4. Hands-on:
    • Feinjustriere dein Modell auf einen speziellen Datensatz (z. B. interne Doku)
    • Baue eine Mini-RAG-Demo (prompt + fetch + generation)
Tag 4: Fortgeschrittene Optimierung & Multimodale Erweiterungen
  • 1. Fortgeschrittene Optimierung
    • Gradient Accumulation, ZeRO, LoRA (Low-Rank Adaptation)
    • Parameter-Effiziente Methoden (QLoRA, 4-Bit/8-Bit Training)
    • Modellkompression, Distillation
  • 2. Multimodale Szenarien
    • Text/Bild (CLIP-Ansätze, Vision Transformer-Encoder + GPT-Decoder)
    • Kurzer Abstecher: Diffusion Models integrieren (für Image Generation)
  • 3. Hands-on:
    • Probier LoRA-Fine-Tuning oder 4-Bit-Quantisierung, um GPU-Speicher zu sparen
    • Experimentiere mit kleiner Bild/Text-Integration (z. B. Bild-Captions)
Tag 5: Production-Ready & Abschlussprojekt
  • 1. Deployment & Skalierung
    • Serving-Frameworks (FastAPI, Triton Inference Server)
    • Monitoring & Logging
    • Parallel-LLM-Setups (Fallback, Ensembles)
  • 2. Sicherheit & Governance
    • Prompt Injection-Verhinderung, Content Filtering
    • Datenschutz und On-Prem-Lösungen
  • 3. Abschlussprojekt
    • Wähle: 
      • Eigener GPT-Klon (kleines Modell)
      • RAG-System mit selbst trainiertem Modell
      • Multimodaler Mini-Prototyp (Text + Bild)
      • Stelle Ergebnisse vor, diskutiere Performance und Limitierungen
  • 4. Ausblick
    • Größere Modelle (Llama, Bloom)
    • HPC-Anforderungen, verteiltes Training
    • Kommerzielle vs. Open-Source-Varianten
LernzieleDiese Masterclass vermittelt ein tiefgehendes Verständnis darüber, wie LLMs aufgebaut, trainiert und optimiert werden. Die Teilnehmenden lernen, eigene Transformer-Modelle zu entwickeln, die richtigen Datensätze aufzubereiten, Tokenizer zu trainieren und den gesamten Trainingsprozess von LLMs nachzuvollziehen. Neben dem Training von Modellen wird auch Feintuning, Evaluierung und Optimierung behandelt. Nach dem Kurs sind die Teilnehmenden in der Lage, ein eigenes kleines LLM zu trainieren, es zu evaluieren und in Anwendungen zu integrieren. ZielgruppenErfahrene Entwickler:innen, Data Scientists und Machine-Learning-Expert:innen, die tiefer in die Architektur und das Training großer Sprachmodelle eintauchen möchten. Der Fokus liegt auf Modellarchitektur, Datenauswahl, Tokenisierung, Training, Evaluierung und Optimierung. Dieser Kurs richtet sich an erfahrene Entwickler:innen und Data Scientists, die selbst LLMs trainieren oder anpassen möchten. Voraussetzungen sind fundierte Kenntnisse in Python, Machine Learning (PyTorch/TensorFlow) sowie ein grundlegendes Verständnis von Deep Learning-Architekturen. Ideal für Forschende, ML-Ingenieur:innen oder KI Enthusiast:innen, die eigene Modelle entwickeln oder tiefgehendes Wissen über Sprachmodelle erlangen möchten.
Tag 1: Deep Dive - Architektur & Daten 1. Eigene LLM-Architektur
  • Transformer intern (Self-Attention, Multi-Head, Position Embeddings)
  • GPT-Style Decoder vs. Encoder-Decoder (T5, BART)
  • 2. Datenauswahl ...
Mehr Informationen

Termine und Orte

Datum Dauer Preis
Webinar
17.08.2026 - 21.08.2026 35 h 35 h Details Details Jetzt buchen
16.11.2026 - 20.11.2026 35 h 35 h Details Details Jetzt buchen
01.02.2027 - 05.02.2027 35 h 35 h Details Details Jetzt buchen
10.05.2027 - 14.05.2027 35 h 35 h Details Details Jetzt buchen
02.08.2027 - 06.08.2027 35 h 35 h Details Details Jetzt buchen
08.11.2027 - 12.11.2027 35 h 35 h Details Details Jetzt buchen

SG-Seminar-Nr.: 9265932

Anbieter-Seminar-Nr.: 5259

Termine

  • 17.08.2026 - 21.08.2026

    Webinar

  • 16.11.2026 - 20.11.2026

    Webinar

  • 01.02.2027 - 05.02.2027

    Webinar

  • 10.05.2027 - 14.05.2027

    Webinar

  • 02.08.2027 - 06.08.2027

    Webinar

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Seminar merken
Vergleichen
Jetzt buchen

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Webinar
  • Deutsch
    • Keine
  • 35 h
  • Anbieterbewertung   (258)

Ihre Vorteile

mehr erfahren
  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Dauer Preis
Webinar
17.08.2026 - 21.08.2026 35 h 35 h Details Details Jetzt buchen
16.11.2026 - 20.11.2026 35 h 35 h Details Details Jetzt buchen
01.02.2027 - 05.02.2027 35 h 35 h Details Details Jetzt buchen
10.05.2027 - 14.05.2027 35 h 35 h Details Details Jetzt buchen
02.08.2027 - 06.08.2027 35 h 35 h Details Details Jetzt buchen
08.11.2027 - 12.11.2027 35 h 35 h Details Details Jetzt buchen