ComenzarEmpieza gratis

Similitud de Doc con spaCy

La similitud semántica consiste en analizar varias frases para identificar qué tienen en común. En este ejercicio, practicarás cómo calcular la similitud semántica de documentos respecto a un documento dado. El objetivo es clasificar una lista de reseñas que sean relevantes para canned dog food.

La categoría canned dog food está almacenada en category. Tienes una muestra de cinco reseñas de comida en una lista llamada texts. en_core_web_md está cargado como nlp.

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Instrucciones del ejercicio

  • Crea una lista documents que contenga contenedores Doc para todos los elementos de texts.
  • Crea un contenedor Doc a partir de category y guárdalo como category_document.
  • Recorre documents e imprime las puntuaciones de similitud de cada contenedor Doc con category_document, redondeadas a tres decimales.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Editar y ejecutar código