Trouver le produit le plus similaire
La possibilité de calculer la similarité entre les enregistrements est une étape clé dans les applications d'enregistrements. Dans cet exercice, vous reviendrez à la liste de dictionnaires products
avec laquelle vous avez travaillé précédemment et qui contient les descriptions courtes intégrées que vous avez également créées plus tôt.
Vous comparerez un texte à ces descriptions intégrées afin d'identifier la description la plus similaire.
numpy
a été importé en tant que np
, et distance
est disponible à partir de scipy.spatial
. Une fonction create_embeddings()
a déjà été définie pour vous et est disponible pour créer des embeddings à partir d'une seule entrée.
Cet exercice fait partie du cours
Introduction à l'intégration avec l'API OpenAI
Instructions
- Incorporez le texte,
"soap"
, à l'aide de votre fonction personnaliséecreate_embeddings()
et extrayez une liste unique d'incorporations. - Calculez la distance en cosinus entre
query_embedding
et les encastrements dansproduct
. - Trouvez et imprimez le site
'short_description'
du produit le plus similaire au texte recherché en utilisant les distances cosinus dansdistances
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Embed the search text
search_text = "soap"
search_embedding = ____
distances = []
for product in products:
# Compute the cosine distance for each product description
dist = ____(search_embedding, ____)
distances.append(dist)
# Find and print the most similar product short_description
min_dist_ind = ____
print(____)