Executando um pipeline do spaCy
Você já executou um pipeline de NLP do spaCy em um único texto e também extraiu tokens de uma lista de contêineres Doc. Neste exercício, você vai praticar as etapas iniciais para executar um pipeline do spaCy em texts, que é uma lista de strings de texto.
Você usará o modelo en_core_web_sm para isso. O pacote spaCy já foi importado para você.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Carregue o modelo
en_core_web_smcomonlp. - Execute o modelo
nlp()em cada item detextse adicione cada contêinerDoccorrespondente a uma listadocuments. - Imprima os textos dos tokens para cada contêiner
Docda listadocuments.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load en_core_web_sm model as nlp
nlp = spacy.____(____)
# Run an nlp model on each item of texts and append the Doc container to documents
documents = []
for text in ____:
documents.append(____)
# Print the token texts for each Doc container
for doc in documents:
print([____ for ____ in ____])