CommencerCommencer gratuitement

Trouver le produit le plus similaire

Savoir calculer la similarité entre des embeddings est une étape clé dans les applications d’embeddings. Dans cet exercice, vous allez revenir à la liste de dictionnaires products utilisée précédemment, qui contient aussi les courtes descriptions vectorisées créées plus tôt.

Vous comparerez un texte à ces descriptions vectorisées afin d’identifier la description la plus similaire.

numpy a été importé sous le nom np, et distance est disponible depuis scipy.spatial. Une fonction create_embeddings() a déjà été définie pour vous et est prête à être utilisée pour créer des embeddings à partir d’une seule entrée.

Cet exercice fait partie du cours

Introduction aux embeddings avec l’API OpenAI

Afficher le cours

Instructions

  • Vectorisez le texte "soap" en utilisant votre fonction personnalisée create_embeddings() et extrayez une unique liste d’embeddings.
  • Calculez la distance cosinus entre le query_embedding et les embeddings dans product.
  • Trouvez et affichez le 'short_description' du produit le plus similaire au texte recherché en utilisant les distances dans distances.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Embed the search text
search_text = "soap"
search_embedding = ____

distances = []
for product in products:
  # Compute the cosine distance for each product description
  dist = ____(search_embedding, ____)
  distances.append(dist)

# Find and print the most similar product short_description    
min_dist_ind = ____
print(____)
Modifier et exécuter le code