Similitud de Doc con spaCy
La similitud semántica consiste en analizar varias frases para identificar qué tienen en común. En este ejercicio, practicarás cómo calcular la similitud semántica de documentos respecto a un documento dado. El objetivo es clasificar una lista de reseñas que sean relevantes para canned dog food.
La categoría canned dog food está almacenada en category. Tienes una muestra de cinco reseñas de comida en una lista llamada texts. en_core_web_md está cargado como nlp.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Crea una lista
documentsque contenga contenedoresDocpara todos los elementos detexts. - Crea un contenedor
Doca partir decategoryy guárdalo comocategory_document. - Recorre
documentse imprime las puntuaciones de similitud de cada contenedorDocconcategory_document, redondeadas a tres decimales.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))