Text vorverarbeiten
Um ein Empfehlungssystem oder ein anderes Modell zu bauen, muss der Text zuerst vorverarbeitet werden.
Hier ist ein Textabschnitt aus Sherlock Holmes geladen. Verarbeite diesen Text mit den im Video vorgestellten Techniken vor, um ihn für weitere Analysen aufzubereiten.
Die Variable text ist ein Auszug aus The Hound of the Baskervilles von Arthur Conan Doyle.
Die folgenden Pakete und Funktionen wurden für dich geladen:
nltk, torch, get_tokenizer, PorterStemmer, stopwords.
Diese Übung ist Teil des Kurses
Deep Learning für Text mit PyTorch
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Initialize and tokenize the text
tokenizer = ____("basic_english")
tokens = ____(____)
print(tokens)