Aan de slagGa gratis aan de slag

Span-overeenkomst met spaCy

Semantische overeenkomst bepalen kan je helpen om teksten in vooraf gedefinieerde categorieën in te delen, relevante teksten te detecteren of dubbele inhoud te markeren. In deze oefening oefen je met het berekenen van de semantische overeenkomst van spans uit een document met een gegeven document. Het doel is om de meest relevante Span van drie tokens te vinden die relevant is voor canned dog food.

De gegeven categorie canned dog food is opgeslagen in category. Een tekststring is al opgeslagen in het object text en en_core_web_md is geladen als nlp. De Doc-container van de text is ook al aangemaakt en opgeslagen in document.

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

Cursus bekijken

Oefeninstructies

  • Maak een Doc-container voor de category en sla die op in category_document.
  • Print de similariteitsscore van een gegeven Span en de category_document, afgerond op drie cijfers.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)

# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))
Code bewerken en uitvoeren