In diesem praxisnahen Seminar lernen Sie, wie Sie Sprache mit Python analysieren und verarbeiten. Sie nutzen spaCy zur Tokenisierung, Entitätenerkennung und syntaktischen Analyse und setzen eigene Verarbeitungslogiken um.
Im zweiten Teil arbeiten Sie mit leistungsstarken Transformer-Modellen über Hugging Face. Sie verwenden vortrainierte Modelle, passen sie an eigene Daten an und generieren Texte mit Prompt Engineering – für Chatbots, Textzusammenfassungen oder Informationsextraktion.
Hinweis:
Dieses Seminar ist ein Angebot der PC-COLLEGE Gruppe.
Inhalt:
- Grundlagen Natural Language Processing mit Python
- - Einführung in NLP-Konzepte
- - Datenformate (z. B. Plain Text, JSON, CSV)
- - Einsatzgebiete wie Textklassifikation, Stimmungsanalyse, semantische Suche
- Textanalyse mit spaCy
- - Aufbau von NLP-Pipelines
- - Tokenisierung, Lemmatisierung
- - POS-Tagging
- - Named Entity Recognition (NER)
- - Rule-Based Matching
- Arbeiten mit Transformer-Modellen (Hugging Face)
- - Nutzung vortrainierter Modelle wie BERT, RoBERTa und GPT
- - Durchführung von Inferenz auf Textdaten
- - Transfer auf eigene Anwendungsfälle
- Fine-Tuning von NLP-Modellen
- - Vorbereitung eigener Datensätze
- - Trainingsstrategien für Klassifikation oder NER
- - Evaluierung und Optimierung
- Prompt Engineering für generative Modelle
- - Struktur und Logik effektiver Prompts
- - Zero-/Few-Shot Learning
- - Anwendung auf Textzusammenfassung, Q&A und Chatbots
- Best Practices und Fallbeispiele aus der Praxis
- - Typische Stolpersteine
- - Modellwahl und Tool-Vergleich
- - Umsetzung von Prototypen in produktionsnahen Umgebungen
Direktlink zum Kurs!