ComeçarComece de graça

Similaridade de Doc com spaCy

Similaridade semântica é o processo de analisar várias sentenças para identificar semelhanças entre elas. Neste exercício, você vai praticar o cálculo de similaridades semânticas de documentos em relação a um documento específico. O objetivo é categorizar uma lista de avaliações que sejam relevantes para canned dog food.

A categoria canned dog food está armazenada em category. Uma amostra de cinco avaliações de alimentos foi fornecida para você em uma lista chamada texts. en_core_web_md está carregado como nlp.

Este exercício faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercício

  • Crie uma lista documents contendo contêineres Doc de todos os texts.
  • Crie um contêiner Doc de category e armazene-o como category_document.
  • Faça um loop por documents e imprima as pontuações de similaridade de cada contêiner Doc com category_document, arredondadas para três casas decimais.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Editar e executar o código