Preprocessare il testo

Per costruire un sistema di raccomandazione, o qualsiasi modello, è necessario prima preprocessare il testo.

Qui è caricato un brano tratto da Sherlock Holmes. Preprocessa questo testo usando le varie tecniche presentate nel video per prepararlo ad analisi successive.

La variabile text è un estratto da Il mastino dei Baskerville di Arthur Conan Doyle.

I seguenti pacchetti e funzioni sono già stati caricati per te: nltk, torch, get_tokenizer, PorterStemmer, stopwords.

Questo esercizio fa parte del corso

Deep Learning per il testo con PyTorch

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Initialize and tokenize the text
tokenizer = ____("basic_english")
tokens = ____(____)
print(tokens)

Modifica ed esegui il codice