or
Diese Übung ist Teil des Kurses
Lerne die Grundlagen der Textverarbeitung im Natural Language Processing (NLP). Beherrsche Techniken wie Tokenisierung, das Entfernen von Stoppwörtern und Satzzeichen sowie die Normalisierung von Text durch Kleinschreibung, Stemming und Lemmatisierung, um Textdaten für weitere Analysen und Erkenntnisse aufzubereiten.
Wandle Rohtext in aussagekräftige numerische Merkmale um. Erstelle Bag-of-Words- und TF-IDF-Repräsentationen, um die Wichtigkeit von Wörtern über Dokumente hinweg zu erfassen, und erkunde anschließend Wort-Embeddings wie Word2Vec und GloVe, um tiefere semantische Muster sichtbar zu machen. Visualisiere Häufigkeit, Relevanz und Ähnlichkeit, um deine Textdaten zum Leben zu erwecken.
Aktuelle Übung
Nutze die Stärke vortrainierter Modelle, um anspruchsvolle Textklassifikationsaufgaben zu lösen. Verwende Hugging Face Pipelines für Sentiment-Analyse, Themenklassifikation und Natural Language Inference. Bewerte semantische Ähnlichkeit und grammatische Korrektheit mit State-of-the-Art-Modellen – ganz ohne alles von Grund auf neu zu bauen.
Tauche in den Kern moderner NLP-Anwendungen mit Token-Klassifikation und Textgenerierung ein. Lerne, mit NER und PoS-Tagging bedeutungsvolle Entitäten und grammatische Strukturen zu extrahieren. Beherrsche sowohl extraktives als auch abstraktives Question Answering und erkunde fortgeschrittene Generierungsaufgaben wie Zusammenfassung, Übersetzung und Language Modeling mit Hugging Face Pipelines.