Trouver le produit le plus similaire
Savoir calculer la similarité entre des embeddings est une étape clé dans les applications d’embeddings. Dans cet exercice, vous allez revenir à la liste de dictionnaires products utilisée précédemment, qui contient aussi les courtes descriptions vectorisées créées plus tôt.
Vous comparerez un texte à ces descriptions vectorisées afin d’identifier la description la plus similaire.
numpy a été importé sous le nom np, et distance est disponible depuis scipy.spatial. Une fonction create_embeddings() a déjà été définie pour vous et est prête à être utilisée pour créer des embeddings à partir d’une seule entrée.
Cet exercice fait partie du cours
Introduction aux embeddings avec l’API OpenAI
Instructions
- Vectorisez le texte
"soap"en utilisant votre fonction personnaliséecreate_embeddings()et extrayez une unique liste d’embeddings. - Calculez la distance cosinus entre le
query_embeddinget les embeddings dansproduct. - Trouvez et affichez le
'short_description'du produit le plus similaire au texte recherché en utilisant les distances dansdistances.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Embed the search text
search_text = "soap"
search_embedding = ____
distances = []
for product in products:
# Compute the cosine distance for each product description
dist = ____(search_embedding, ____)
distances.append(dist)
# Find and print the most similar product short_description
min_dist_ind = ____
print(____)