Eseguire una pipeline spaCy

Hai già eseguito una pipeline NLP di spaCy su un singolo testo e hai anche estratto i token da un determinato elenco di contenitori Doc. In questo esercizio farai pratica con i passaggi iniziali per eseguire una pipeline spaCy su texts, che è un elenco di stringhe di testo.

Userai il modello en_core_web_sm per questo scopo. Il pacchetto spaCy è già stato importato per te.

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza corso

Istruzioni dell'esercizio

Carica il modello en_core_web_sm come nlp.
Esegui il modello nlp() su ogni elemento di texts e aggiungi ciascun contenitore Doc corrispondente a una lista documents.
Stampa i testi dei token per ciascun contenitore Doc della lista documents.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Load en_core_web_sm model as nlp
nlp = spacy.____(____)

# Run an nlp model on each item of texts and append the Doc container to documents
documents = []
for text in ____:
  documents.append(____)
  
# Print the token texts for each Doc container
for doc in documents:
  print([____ for ____ in ____])

Modifica ed esegui il codice