ComeçarComece de graça

Segmentação de frases com spaCy

Neste exercício, você vai praticar segmentação de frases. Em NLP, dividir um documento em suas frases é uma operação básica útil. É uma das primeiras etapas em muitas tarefas de NLP mais elaboradas, como a detecção de entidades nomeadas. Além disso, capturar o número de frases pode dar uma ideia da quantidade de informação que o texto traz.

Você pode acessar dez avaliações de comida na lista chamada texts.

O modelo en_core_web_sm já foi carregado para você como nlp e .

Este exercício faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercício

  • Execute o modelo spaCy em cada item da lista texts para compilar documents, uma lista com todos os contêineres Doc.
  • Extraia as frases de cada contêiner doc iterando sobre a lista documents e adicione-as a uma lista chamada sentences.
  • Conte o número de frases em cada contêiner doc usando a lista sentences.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Generating a documents list of all Doc containers
documents = [____(text) for text in texts]

# Iterate through documents and append sentences in each doc to the sentences list
sentences = []
for doc in documents:
  sentences.append([s for s in ____.____])
  
# Find number of sentences per each doc container
print([len(____) for s in sentences])
Editar e executar o código