IniziaInizia gratis

Pipeline di preprocessing per il linguaggio shakespeariano

Nel team di PyBooks vogliono trasformare una vasta libreria di testi shakespeariani per ulteriori analisi. Il modo più efficiente per farlo è costruire una pipeline di elaborazione del testo, a partire dai passaggi di preprocessing.

Sono già stati caricati per te: torch, nltk, stopwords, PorterStemmer, get_tokenizer.

I testi shakespeariani sono salvati in shakespeare e le frasi sono già state estratte.

Questo esercizio fa parte del corso

Deep Learning per il testo con PyTorch

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a list of stopwords
stop_words = set(____(____))
Modifica ed esegui il codice