LoslegenKostenlos starten

Vorverarbeitungspipeline für Shakespeare-Sprache

Bei PyBooks möchte das Team eine große Bibliothek mit Shakespeare-Textdaten für weitere Analysen aufbereiten. Am effizientesten geht das mit einer Textverarbeitungspipeline, beginnend mit den Vorverarbeitungsschritten.

Folgendes wurde für dich geladen: torch, nltk, stopwords, PorterStemmer, get_tokenizer.

Die Shakespeare-Textdaten sind als shakespeare gespeichert, und die Sätze wurden bereits extrahiert.

Diese Übung ist Teil des Kurses

<Kurs>Deep Learning für Text mit PyTorch</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a list of stopwords
stop_words = set(____(____))
Code bearbeiten und ausführen