Aan de slagGa gratis aan de slag

Doc-overeenkomst met spaCy

Semantische overeenkomst is het proces waarbij je meerdere zinnen analyseert om overeenkomsten ertussen te vinden. In deze oefening ga je oefenen met het berekenen van semantische overeenkomsten van documenten ten opzichte van een gegeven document. Het doel is om een lijst met gegeven reviews te categoriseren die relevant zijn voor canned dog food.

De categorie canned dog food is opgeslagen in category. Een voorbeeld van vijf voedselreviews is voor je klaargezet in een lijst texts. en_core_web_md is geladen als nlp.

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

Cursus bekijken

Oefeninstructies

  • Maak een lijst documents met Doc-containers van alle texts.
  • Maak een Doc-container van de category en sla deze op als category_document.
  • Loop door documents en print de overeenkomstscores van elke Doc-container met de category_document, afgerond op drie decimalen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Code bewerken en uitvoeren