ComeçarComece de graça

Processamento de texto com spaCy

Toda aplicação de NLP é composta por várias etapas de processamento de texto. Você já aprendeu algumas dessas etapas, incluindo tokenização, lematização, segmentação de sentenças e reconhecimento de entidades nomeadas.

spaCy NLP Pipeline

Neste exercício, você vai continuar praticando etapas de processamento de texto no spaCy, como dividir o texto em sentenças e extrair entidades nomeadas. Você usará as primeiras cinco avaliações do conjunto de dados Amazon Fine Food Reviews. Você pode acessá-las usando o objeto texts.

O modelo en_core_web_sm já foi carregado para você e pode ser acessado por meio de nlp. A lista de contêineres Doc para cada item em texts também já está pré-carregada e pode ser acessada em documents.

Este exercício faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]

# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)
Editar e executar o código