Preprocessare il testo
Per costruire un sistema di raccomandazione, o qualsiasi modello, è necessario prima preprocessare il testo.
Qui è caricato un brano tratto da Sherlock Holmes. Preprocessa questo testo usando le varie tecniche presentate nel video per prepararlo ad analisi successive.
La variabile text è un estratto da Il mastino dei Baskerville di Arthur Conan Doyle.
I seguenti pacchetti e funzioni sono già stati caricati per te:
nltk, torch, get_tokenizer, PorterStemmer, stopwords.
Questo esercizio fa parte del corso
Deep Learning per il testo con PyTorch
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Initialize and tokenize the text
tokenizer = ____("basic_english")
tokens = ____(____)
print(tokens)