LoslegenKostenlos loslegen

Text vorverarbeiten

Um ein Empfehlungssystem oder ein anderes Modell zu bauen, muss der Text zuerst vorverarbeitet werden.

Hier ist ein Textabschnitt aus Sherlock Holmes geladen. Verarbeite diesen Text mit den im Video vorgestellten Techniken vor, um ihn für weitere Analysen aufzubereiten.

Die Variable text ist ein Auszug aus The Hound of the Baskervilles von Arthur Conan Doyle.

Die folgenden Pakete und Funktionen wurden für dich geladen: nltk, torch, get_tokenizer, PorterStemmer, stopwords.

Diese Übung ist Teil des Kurses

Deep Learning für Text mit PyTorch

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Initialize and tokenize the text
tokenizer = ____("basic_english")
tokens = ____(____)
print(tokens)
Code bearbeiten und ausführen