Pipeline di preprocessing per il linguaggio shakespeariano
Nel team di PyBooks vogliono trasformare una vasta libreria di testi shakespeariani per ulteriori analisi. Il modo più efficiente per farlo è costruire una pipeline di elaborazione del testo, a partire dai passaggi di preprocessing.
Sono già stati caricati per te:
torch, nltk, stopwords, PorterStemmer, get_tokenizer.
I testi shakespeariani sono salvati in shakespeare e le frasi sono già state estratte.
Questo esercizio fa parte del corso
Deep Learning per il testo con PyTorch
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a list of stopwords
stop_words = set(____(____))