Vorverarbeitungspipeline für Shakespeare-Sprache
Bei PyBooks möchte das Team eine große Bibliothek mit Shakespeare-Textdaten für weitere Analysen aufbereiten. Am effizientesten geht das mit einer Textverarbeitungspipeline, beginnend mit den Vorverarbeitungsschritten.
Folgendes wurde für dich geladen:
torch, nltk, stopwords, PorterStemmer, get_tokenizer.
Die Shakespeare-Textdaten sind als shakespeare gespeichert, und die Sätze wurden bereits extrahiert.
Diese Übung ist Teil des Kurses
<Kurs>Deep Learning für Text mit PyTorch</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a list of stopwords
stop_words = set(____(____))