Similitud de spans con spaCy
Determinar la similitud semántica puede ayudarte a clasificar textos en categorías predefinidas, detectar textos relevantes o señalar contenido duplicado. En este ejercicio, practicarás el cálculo de similitudes semánticas de spans de un documento con respecto a un documento dado. El objetivo es encontrar el Span de tres tokens más relevante para canned dog food.
La categoría canned dog food se guarda en category. Una cadena de texto ya está almacenada en el objeto text y en_core_web_md está cargado como nlp. El contenedor Doc de text también está creado y guardado en document.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Crea un contenedor
Docparacategoryy guárdalo encategory_document. - Imprime la puntuación de similitud de un
Spandado ycategory_document, redondeada a tres decimales.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)
# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))