Webinar

Generative KI Masterclass: Ein eigenes LLM bauen und trainieren

Empfehlen Frage stellen Inhouse anfragen Drucken/ PDF

Inhalte

Tag 1: Deep Dive - Architektur & Daten 1. Eigene LLM-Architektur

Transformer intern (Self-Attention, Multi-Head, Position Embeddings)
GPT-Style Decoder vs. Encoder-Decoder (T5, BART)
2. Datenauswahl & Aufbereitung
Öffentliche Datensätze (The Pile, Books3, OpenWebText2)
Copyright & Cleanup (Duplikate, Filters)
Geschlossene/unternehmensinterne Daten (Datenschutz)
3. Tokenisierung
Byte Pair Encoding (BPE), SentencePiece, ttoken
Vocabulary-Größe, Trade-offs
4. Hands-on:
Erstes Skript: Tokenizer-Training auf einem Mini-Korpus
Großer Korpus? Wie man ihn vorbereitet (Chunking, Sharding, etc.)

Tag 2: Implementierung & Training-Pipeline

1. Implementierung eines Mini-Transformers
- PyTorch oder TensorFlow: Layer (Attention, Feedforward), GPTBlock / DecoderLayer
- Konfigurationsparameter (Hidden Dim, Heads, Depth)
2. Training-Setup
- GPU/TPU-Einrichtung (lokal vs. Cloud)
- Batch Size, Lernrate, Optimizer (AdamW)
- Mixed Precision (FP16/BF16)
3. MLOps-Tools
- MLflow, ClearML oder Weights & Biases zum Tracken von Experimenten
4. Hands-on:
- Starte ein Trainingsskript für einen kleinen Datensatz (z. B. 50-100 MB Text)
- Protokolliere Training Loss, evaluiere gelegentliche Samples

Tag 3: Feintuning, Evaluierung & RAG

1. Weiterführendes Training
- Feintuning vs. Training-from-scratch
- RLHF (Reinforcement Learning from Human Feedback) - theoretischer Überblick
2. Evaluierung
- Perplexity, Token-Accuracy
- Generische Metriken: BLEU, ROUGE, etc.
3. Retrieval-Augmented Generation
- Eigene RAG-Pipeline auf selbst trainiertem Modell?
- Einbinden einer Vektordatenbank (Chroma, FAISS)
4. Hands-on:
- Feinjustriere dein Modell auf einen speziellen Datensatz (z. B. interne Doku)
- Baue eine Mini-RAG-Demo (prompt + fetch + generation)

Tag 4: Fortgeschrittene Optimierung & Multimodale Erweiterungen

1. Fortgeschrittene Optimierung
- Gradient Accumulation, ZeRO, LoRA (Low-Rank Adaptation)
- Parameter-Effiziente Methoden (QLoRA, 4-Bit/8-Bit Training)
- Modellkompression, Distillation
2. Multimodale Szenarien
- Text/Bild (CLIP-Ansätze, Vision Transformer-Encoder + GPT-Decoder)
- Kurzer Abstecher: Diffusion Models integrieren (für Image Generation)
3. Hands-on:
- Probier LoRA-Fine-Tuning oder 4-Bit-Quantisierung, um GPU-Speicher zu sparen
- Experimentiere mit kleiner Bild/Text-Integration (z. B. Bild-Captions)

Tag 5: Production-Ready & Abschlussprojekt

1. Deployment & Skalierung
- Serving-Frameworks (FastAPI, Triton Inference Server)
- Monitoring & Logging
- Parallel-LLM-Setups (Fallback, Ensembles)
2. Sicherheit & Governance
- Prompt Injection-Verhinderung, Content Filtering
- Datenschutz und On-Prem-Lösungen
3. Abschlussprojekt
- Wähle:
  - Eigener GPT-Klon (kleines Modell)
  - RAG-System mit selbst trainiertem Modell
  - Multimodaler Mini-Prototyp (Text + Bild)
  - Stelle Ergebnisse vor, diskutiere Performance und Limitierungen
4. Ausblick
- Größere Modelle (Llama, Bloom)
- HPC-Anforderungen, verteiltes Training
- Kommerzielle vs. Open-Source-Varianten

LernzieleDiese Masterclass vermittelt ein tiefgehendes Verständnis darüber, wie LLMs aufgebaut, trainiert und optimiert werden. Die Teilnehmenden lernen, eigene Transformer-Modelle zu entwickeln, die richtigen Datensätze aufzubereiten, Tokenizer zu trainieren und den gesamten Trainingsprozess von LLMs nachzuvollziehen. Neben dem Training von Modellen wird auch Feintuning, Evaluierung und Optimierung behandelt. Nach dem Kurs sind die Teilnehmenden in der Lage, ein eigenes kleines LLM zu trainieren, es zu evaluieren und in Anwendungen zu integrieren. ZielgruppenErfahrene Entwickler:innen, Data Scientists und Machine-Learning-Expert:innen, die tiefer in die Architektur und das Training großer Sprachmodelle eintauchen möchten. Der Fokus liegt auf Modellarchitektur, Datenauswahl, Tokenisierung, Training, Evaluierung und Optimierung. Dieser Kurs richtet sich an erfahrene Entwickler:innen und Data Scientists, die selbst LLMs trainieren oder anpassen möchten. Voraussetzungen sind fundierte Kenntnisse in Python, Machine Learning (PyTorch/TensorFlow) sowie ein grundlegendes Verständnis von Deep Learning-Architekturen. Ideal für Forschende, ML-Ingenieur:innen oder KI Enthusiast:innen, die eigene Modelle entwickeln oder tiefgehendes Wissen über Sprachmodelle erlangen möchten.

Tag 1: Deep Dive - Architektur & Daten 1. Eigene LLM-Architektur

Transformer intern (Self-Attention, Multi-Head, Position Embeddings)
GPT-Style Decoder vs. Encoder-Decoder (T5, BART)
2. Datenauswahl ...

Mehr Informationen

Termine und Orte

Datum	Dauer
Webinar
17.08.2026 - 21.08.2026 35 h	35 h	Details	Details Jetzt buchen
16.11.2026 - 20.11.2026 35 h	35 h	Details	Details Jetzt buchen
01.02.2027 - 05.02.2027 35 h	35 h	Details	Details Jetzt buchen
10.05.2027 - 14.05.2027 35 h	35 h	Details	Details Jetzt buchen
02.08.2027 - 06.08.2027 35 h	35 h	Details	Details Jetzt buchen
08.11.2027 - 12.11.2027 35 h	35 h	Details	Details Jetzt buchen

SG-Seminar-Nr.: 9265932

Anbieter-Seminar-Nr.: 5259

Termine

17.08.2026 - 21.08.2026

Webinar
16.11.2026 - 20.11.2026

Webinar
01.02.2027 - 05.02.2027

Webinar
10.05.2027 - 14.05.2027

Webinar
02.08.2027 - 06.08.2027

Webinar

1 weiterer Termin

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Seminar merken

Vergleichen

Jetzt buchen

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

Webinar
Deutsch
- Keine
35 h
Anbieterbewertung (258)

Ihre Vorteile

mehr erfahren

Anbietervergleich von über 1.500 Seminaranbietern
Vollständige Veranstaltungsinformationen
Schnellbuchung
Persönlicher Service

Datum	Dauer
Webinar
17.08.2026 - 21.08.2026 35 h	35 h	Details	Details Jetzt buchen
16.11.2026 - 20.11.2026 35 h	35 h	Details	Details Jetzt buchen
01.02.2027 - 05.02.2027 35 h	35 h	Details	Details Jetzt buchen
10.05.2027 - 14.05.2027 35 h	35 h	Details	Details Jetzt buchen
02.08.2027 - 06.08.2027 35 h	35 h	Details	Details Jetzt buchen
08.11.2027 - 12.11.2027 35 h	35 h	Details	Details Jetzt buchen

Abbrechen

Generative KI Masterclass: Ein eigenes LLM bauen und trainieren

Inhalte

Termine und Orte

Termine

17.08.2026 - 21.08.2026

16.11.2026 - 20.11.2026

01.02.2027 - 05.02.2027

10.05.2027 - 14.05.2027

02.08.2027 - 06.08.2027

Veranstaltungsinformation

Ihre Vorteile