Natural Language Processing (NLP) mit R - Seminar / Kurs von DHL Data Science Seminare GmbH

Inhalte

Dieser Kurs ist das dritte Modul des Lehrgangs „Data Science Crash Course mit R”. Sie erhalten eine fundierte Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning für numerische und symbolische Daten.

Das Seminar „Natural Language Processing (NLP) mit R” gibt einen Einblick, wie Sie symbolische Daten (wie Wörter) verarbeiten können und dadurch ein Verständnis von Text und Sätzen erhalten. Diese Fertigkeit können Sie dann anwenden, um z. B. einen eigenen Chatbot zu entwickeln oder andere symbolische oder ereignis-basierte Daten (wie z. B. Seitenaufrufe) zu modellieren und vorherzusagen. Gerne können Sie Ihre eigene Fragestellung inkl. der notwendigen Daten mitbringen.

Viele denken beim Thema Künstliche Intelligenz oft an Chatbots oder digitale Assistenten. Damit diese künstlichen Agenten oder Bots überhaupt mit uns interagieren können, benötigen sie ein gewisses Sprachverständnis. Hierfür wird die natürliche Sprachverarbeitung, oder Natural Language Processing (NLP) eingesetzt.

Ein weiteres wichtiges Thema ist die Datengewinnung. Algorithmen des Maschinellen Lernens benötigen Daten - diese sind aber oft nicht ausreichend vorhanden. Durch sogenanntes Web Scraping bzw. Web Crawling können Sie Daten aus dem World Wide Web zusammensuchen und für Ihre Anwendung nutzbar machen. Dabei erfahren Sie zum einen, wie dies mittels R und Regular Expressions funktioniert und zum anderen, was Sie dabei aus kommerzieller und ethischer Sicht zu beachten haben.

Der Kurs „Natural Language Processing (NLP) mit R” ist das dritte Modul des Lehrgangs „Data Science Crash Course mit R”. Mit dem Lehrgang erhalten eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten. Infos zum gesamten Lehrgang finden Sie, wenn Sie den Begriff „Data Science Crash Course mit R” in die Semigator-Suche eingeben.

Agenda

  • Web Scraping und Crawling
    • Kommerzielle und ethische Gesichtspunkte
    • Scrapen einer Webseite: requests, robots.txt, html, regex
    • Praxis-Übung: Scrapen einer Webseite
  • Vorverarbeitung von Text
    • Parsing: Tokenizer, Stopwords, Stemming, n-grams
    • Praxis-Übung: Parsen von Data-Science-Texten
  • Praxis-Beispiel I (Topic Clustering)
    • Kurze Einführung in den Kontext und die Zielsetzung
    • Praxis-Übung: Unüberwachtes Lernen/Unsupervised Learning (DBSCAN)
  • Praxis-Beispiel II (Sentiment Analysis)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Überwachtes Lernen/Supervised Learning (Neuronale Netze)
  • Praxis-Beispiel III (Sentence Completion)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Symbolische Zeitreihenvorhersage (Long-Short-Term-Memory/LSTM und Embedding)

Dauer des Seminars

  • Rahmen: 1 Tag mit 8 Unterrichtsstunden (9-17 Uhr)
  • Aufteilung Theorie/Praxis: 40% Vorlesung + 60 % Praxis, Übungen und Demos

Lernziele

Am Ende des Seminars Natural Language Processing (NLP) mit R werden Sie

  • wissen, was Sie beachten müssen, wenn Sie Daten aus dem Internet ziehen (Web Scraping und Web Crawling) - und wie Sie Daten von einer Seite „scrapen” und vorverarbeiten können,
  • wie Sie Texte mittels Tokenizer, Stopwords, Stemming und n-grams vor-verarbeiten bzw. parsen können und
  • einen praktischen Einblick erhalten, wie Sie Topic Clustering, eine Sentiment Analyse und Satz-Vervollständigung mittels Unsupervised und Supervised Learning durchführen können.

Zielgruppen

Das Seminar „Natural Language Processing (NLP) mit R” ist für Beschäftigte aus operativen Bereichen, R&D und IT mit grundlegenden Programmierkenntnissen geeignet, welche die Potenziale von Data Science, Künstlicher Intelligenz und Maschinellem Lernen für ihren Bereich kennenlernen und hautnah erfahren möchten. Anwender, Studenten, Doktoranden und Forscher aus den mathematischen, statistischen, naturwissenschaftlichen, ingenieurwissenschaftlichen, informationstechnologischen, betriebs-, wirtschafts-, markt- und sozialwissenschaftlichen Bereichen sind ebenfalls willkommen.

Inhaltliche Voraussetzungen zur Kursteilnahme

Für das Seminar „Natural Language Processing (NLP) mit R” ist Voraussetzung, entweder das Seminar „Data Science und Künstliche Intelligenz mit R” besucht zu haben oder dessen Inhalte zu kennen. Speziell gehört dazu, mit R programmieren zu können und eine grundsätzliches Verständnis von Modellierung und dem zugehörigen Prozess zu haben. Das Modul „Machine Learning mit R” ist nicht zwingend notwendig, dennoch sollte eine grundlegende Kenntnis über die unterschiedlichen Machine Learning Algorithmen vorhanden sein.

Technische Voraussetzungen zur Kursteilnahme

Präsenzseminare: Bitte bringen Sie Ihren Laptop mit der von Ihnen bislang genutzen R-Umgebung mit. Sie erhalten außerdem eine Installationsanleitung für die Aktualisierung der Installation und der im Unterricht verwendeten R-Pakete.

Online-Seminare: Sie benötigen zur Teilnahme an einem unserer Online-Seminare einen Computer mit Internetzugang (empfohlene Bandbreite 1-2 MBit/s). Sie erhalten nach der Anmeldung eine detaillierte Installationsanleitung für die erforderliche Statistik- und Videokonferenz-Software (Teilnahme mit Browser möglich). Bei Bedarf können Sie einen Fernzugang zu einem Schulungscomputer mit der erforderlichen Software erhalten.

Weitere wichtige Informationen

  • Ort: Online/Präsenz
  • Typ: Intensivkurs
  • Niveau: Fortgeschritten
  • Größe: 4 – 8 Personen
  • Dauer: 1 Tag
  • Zeiten: 9 – 17 Uhr
  • Intervall: alle 3-6 Monate

Dieser Kurs ist das dritte Modul des Lehrgangs „Data Science Crash Course mit R”. Sie erhalten eine fundierte Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning f ...

Mehr Informationen >>

Termine und Orte

Datum Uhrzeit Dauer Preis
Heidenheim an der Brenz, DE
26.06.2026 09:00 - 17:00 Uhr 8 h Mehr Informationen > Jetzt buchen ›
11.12.2026 09:00 - 17:00 Uhr 8 h Mehr Informationen > Jetzt buchen ›

SG-Seminar-Nr.: 8330705

Anbieter-Seminar-Nr.: NLR

Termine

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›
Vergleichen

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Seminar / Kurs
  • Deutsch
    • Keine
  • 8 h
  •  
  • Anbieterbewertung (4)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service
Datum Uhrzeit Dauer Preis
Heidenheim an der Brenz, DE
26.06.2026 09:00 - 17:00 Uhr 8 h Mehr Informationen > Jetzt buchen ›
11.12.2026 09:00 - 17:00 Uhr 8 h Mehr Informationen > Jetzt buchen ›