Trouver le produit le plus similaire

Savoir calculer la similarité entre des embeddings est une étape clé dans les applications d’embeddings. Dans cet exercice, vous allez revenir à la liste de dictionnaires products utilisée précédemment, qui contient aussi les courtes descriptions vectorisées créées plus tôt.

Vous comparerez un texte à ces descriptions vectorisées afin d’identifier la description la plus similaire.

numpy a été importé sous le nom np, et distance est disponible depuis scipy.spatial. Une fonction create_embeddings() a déjà été définie pour vous et est prête à être utilisée pour créer des embeddings à partir d’une seule entrée.

Cet exercice fait partie du cours

<cours>Introduction aux embeddings avec l’API OpenAI</cours>

Voir le cours

Instructions de l’exercice

Vectorisez le texte "soap" en utilisant votre fonction personnalisée create_embeddings() et extrayez une unique liste d’embeddings.
Calculez la distance cosinus entre le query_embedding et les embeddings dans product.
Trouvez et affichez le 'short_description' du produit le plus similaire au texte recherché en utilisant les distances dans distances.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Embed the search text
search_text = "soap"
search_embedding = ____

distances = []
for product in products:
  # Compute the cosine distance for each product description
  dist = ____(search_embedding, ____)
  distances.append(dist)

# Find and print the most similar product short_description    
min_dist_ind = ____
print(____)

Modifier et exécuter le code