Doc-overeenkomst met spaCy
Semantische overeenkomst is het proces waarbij je meerdere zinnen analyseert om overeenkomsten ertussen te vinden. In deze oefening ga je oefenen met het berekenen van semantische overeenkomsten van documenten ten opzichte van een gegeven document. Het doel is om een lijst met gegeven reviews te categoriseren die relevant zijn voor canned dog food.
De categorie canned dog food is opgeslagen in category. Een voorbeeld van vijf voedselreviews is voor je klaargezet in een lijst texts. en_core_web_md is geladen als nlp.
Deze oefening maakt deel uit van de cursus
Natural Language Processing met spaCy
Oefeninstructies
- Maak een lijst
documentsmetDoc-containers van alletexts. - Maak een
Doc-container van decategoryen sla deze op alscategory_document. - Loop door
documentsen print de overeenkomstscores van elkeDoc-container met decategory_document, afgerond op drie decimalen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))