Similaridade de Doc com spaCy
Similaridade semântica é o processo de analisar várias sentenças para identificar semelhanças entre elas. Neste exercício, você vai praticar o cálculo de similaridades semânticas de documentos em relação a um documento específico. O objetivo é categorizar uma lista de avaliações que sejam relevantes para canned dog food.
A categoria canned dog food está armazenada em category. Uma amostra de cinco avaliações de alimentos foi fornecida para você em uma lista chamada texts. en_core_web_md está carregado como nlp.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Crie uma lista
documentscontendo contêineresDocde todos ostexts. - Crie um contêiner
Docdecategorye armazene-o comocategory_document. - Faça um loop por
documentse imprima as pontuações de similaridade de cada contêinerDoccomcategory_document, arredondadas para três casas decimais.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))