Eseguire una pipeline spaCy
Hai già eseguito una pipeline NLP di spaCy su un singolo testo e hai anche estratto i token da un determinato elenco di contenitori Doc. In questo esercizio farai pratica con i passaggi iniziali per eseguire una pipeline spaCy su texts, che è un elenco di stringhe di testo.
Userai il modello en_core_web_sm per questo scopo. Il pacchetto spaCy è già stato importato per te.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Carica il modello
en_core_web_smcomenlp. - Esegui il modello
nlp()su ogni elemento ditextse aggiungi ciascun contenitoreDoccorrispondente a una listadocuments. - Stampa i testi dei token per ciascun contenitore
Docdella listadocuments.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load en_core_web_sm model as nlp
nlp = spacy.____(____)
# Run an nlp model on each item of texts and append the Doc container to documents
documents = []
for text in ____:
documents.append(____)
# Print the token texts for each Doc container
for doc in documents:
print([____ for ____ in ____])