Segmentação de frases com spaCy
Neste exercício, você vai praticar segmentação de frases. Em NLP, dividir um documento em suas frases é uma operação básica útil. É uma das primeiras etapas em muitas tarefas de NLP mais elaboradas, como a detecção de entidades nomeadas. Além disso, capturar o número de frases pode dar uma ideia da quantidade de informação que o texto traz.
Você pode acessar dez avaliações de comida na lista chamada texts.
O modelo en_core_web_sm já foi carregado para você como nlp e .
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Execute o modelo
spaCyem cada item da listatextspara compilardocuments, uma lista com todos os contêineresDoc. - Extraia as frases de cada contêiner
dociterando sobre a listadocumentse adicione-as a uma lista chamadasentences. - Conte o número de frases em cada contêiner
docusando a listasentences.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generating a documents list of all Doc containers
documents = [____(text) for text in texts]
# Iterate through documents and append sentences in each doc to the sentences list
sentences = []
for doc in documents:
sentences.append([s for s in ____.____])
# Find number of sentences per each doc container
print([len(____) for s in sentences])