Pipeline di preprocessing per il linguaggio shakespeariano

Nel team di PyBooks vogliono trasformare una vasta libreria di testi shakespeariani per ulteriori analisi. Il modo più efficiente per farlo è costruire una pipeline di elaborazione del testo, a partire dai passaggi di preprocessing.

Sono già stati caricati per te: torch, nltk, stopwords, PorterStemmer, get_tokenizer.

I testi shakespeariani sono salvati in shakespeare e le frasi sono già state estratte.

Questo esercizio fa parte del corso

Deep Learning per il testo con PyTorch

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a list of stopwords
stop_words = set(____(____))

Modifica ed esegui il codice