Tokenizzazione con spaCy

In questo esercizio farai pratica con la tokenizzazione del testo. Userai la prima recensione del dataset Amazon Fine Food Reviews per questo esercizio. Puoi accedere a questa recensione tramite l'oggetto text fornito.

Il modello en_core_web_sm è già caricato per te. Puoi accedervi chiamando nlp(). Puoi usare una list comprehension per creare le liste di output.

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza corso

Istruzioni dell'esercizio

Memorizza il contenitore Doc per la recensione pre-caricata in un oggetto document.
Memorizza e rivedi i testi di tutti i token del document nella variabile first_text_tokens.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a Doc container of the given text
document = ____(____)
    
# Store and review the token text values of tokens for the Doc container
first_text_tokens = [____ for ____ in ____]
print("First text tokens:\n", first_text_tokens, "\n")

Modifica ed esegui il codice