Text vorverarbeiten
Um ein Empfehlungssystem oder ein anderes Modell zu bauen, muss der Text zuerst vorverarbeitet werden.
Hier ist ein Textabschnitt aus Sherlock Holmes geladen. Verarbeite diesen Text mit den im Video vorgestellten Techniken vor, um ihn für weitere Analysen aufzubereiten.
Die Variable text ist ein Auszug aus The Hound of the Baskervilles von Arthur Conan Doyle.
Die folgenden Pakete und Funktionen wurden für dich geladen:
nltk, torch, get_tokenizer, PorterStemmer, stopwords.
Diese Übung ist Teil des Kurses
<Kurs>Deep Learning für Text mit PyTorch</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Initialize and tokenize the text
tokenizer = ____("basic_english")
tokens = ____(____)
print(tokens)