Similarité de Doc avec spaCy
La similarité sémantique consiste à analyser plusieurs phrases afin d’identifier leurs points communs. Dans cet exercice, vous allez vous entraîner à calculer la similarité sémantique de documents par rapport à un document donné. L’objectif est de catégoriser une liste d’avis correspondant à la catégorie canned dog food.
La catégorie canned dog food est stockée dans category. Un échantillon de cinq avis sur des aliments est fourni dans une liste appelée texts. en_core_web_md est chargé dans nlp.
Cet exercice fait partie du cours
Traitement du langage naturel avec spaCy
Instructions
- Créez une liste
documentscontenant les conteneursDocde tous les éléments detexts. - Créez un conteneur
Docà partir decategoryet stockez-le danscategory_document. - Parcourez
documentset affichez les scores de similarité entre chaque conteneurDocetcategory_document, arrondis à trois décimales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))