Processamento de texto com spaCy
Toda aplicação de NLP é composta por várias etapas de processamento de texto. Você já aprendeu algumas dessas etapas, incluindo tokenização, lematização, segmentação de sentenças e reconhecimento de entidades nomeadas.
Neste exercício, você vai continuar praticando etapas de processamento de texto no spaCy, como dividir o texto em sentenças e extrair entidades nomeadas. Você usará as primeiras cinco avaliações do conjunto de dados Amazon Fine Food Reviews. Você pode acessá-las usando o objeto texts.
O modelo en_core_web_sm já foi carregado para você e pode ser acessado por meio de nlp. A lista de contêineres Doc para cada item em texts também já está pré-carregada e pode ser acessada em documents.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]
# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)