LoslegenKostenlos starten

Text vorverarbeiten

Um ein Empfehlungssystem oder ein anderes Modell zu bauen, muss der Text zuerst vorverarbeitet werden.

Hier ist ein Textabschnitt aus Sherlock Holmes geladen. Verarbeite diesen Text mit den im Video vorgestellten Techniken vor, um ihn für weitere Analysen aufzubereiten.

Die Variable text ist ein Auszug aus The Hound of the Baskervilles von Arthur Conan Doyle.

Die folgenden Pakete und Funktionen wurden für dich geladen: nltk, torch, get_tokenizer, PorterStemmer, stopwords.

Diese Übung ist Teil des Kurses

<Kurs>Deep Learning für Text mit PyTorch</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Initialize and tokenize the text
tokenizer = ____("basic_english")
tokens = ____(____)
print(tokens)
Code bearbeiten und ausführen