Span-overeenkomst met spaCy
Semantische overeenkomst bepalen kan je helpen om teksten in vooraf gedefinieerde categorieën in te delen, relevante teksten te detecteren of dubbele inhoud te markeren. In deze oefening oefen je met het berekenen van de semantische overeenkomst van spans uit een document met een gegeven document. Het doel is om de meest relevante Span van drie tokens te vinden die relevant is voor canned dog food.
De gegeven categorie canned dog food is opgeslagen in category. Een tekststring is al opgeslagen in het object text en en_core_web_md is geladen als nlp. De Doc-container van de text is ook al aangemaakt en opgeslagen in document.
Deze oefening maakt deel uit van de cursus
Natural Language Processing met spaCy
Oefeninstructies
- Maak een
Doc-container voor decategoryen sla die op incategory_document. - Print de similariteitsscore van een gegeven
Spanen decategory_document, afgerond op drie cijfers.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)
# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))