ComenzarEmpieza gratis

Similitud de spans con spaCy

Determinar la similitud semántica puede ayudarte a clasificar textos en categorías predefinidas, detectar textos relevantes o señalar contenido duplicado. En este ejercicio, practicarás el cálculo de similitudes semánticas de spans de un documento con respecto a un documento dado. El objetivo es encontrar el Span de tres tokens más relevante para canned dog food.

La categoría canned dog food se guarda en category. Una cadena de texto ya está almacenada en el objeto text y en_core_web_md está cargado como nlp. El contenedor Doc de text también está creado y guardado en document.

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Instrucciones del ejercicio

  • Crea un contenedor Doc para category y guárdalo en category_document.
  • Imprime la puntuación de similitud de un Span dado y category_document, redondeada a tres decimales.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)

# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))
Editar y ejecutar código