CommencerCommencer gratuitement

Similarité de Doc avec spaCy

La similarité sémantique consiste à analyser plusieurs phrases afin d’identifier leurs points communs. Dans cet exercice, vous allez vous entraîner à calculer la similarité sémantique de documents par rapport à un document donné. L’objectif est de catégoriser une liste d’avis correspondant à la catégorie canned dog food.

La catégorie canned dog food est stockée dans category. Un échantillon de cinq avis sur des aliments est fourni dans une liste appelée texts. en_core_web_md est chargé dans nlp.

Cet exercice fait partie du cours

Traitement du langage naturel avec spaCy

Afficher le cours

Instructions

  • Créez une liste documents contenant les conteneurs Doc de tous les éléments de texts.
  • Créez un conteneur Doc à partir de category et stockez-le dans category_document.
  • Parcourez documents et affichez les scores de similarité entre chaque conteneur Doc et category_document, arrondis à trois décimales.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Modifier et exécuter le code