Trouver le produit le plus similaire
La possibilité de calculer la similarité entre les enregistrements est une étape clé dans les applications d'enregistrements. Dans cet exercice, vous reviendrez à la liste de dictionnaires products avec laquelle vous avez travaillé précédemment et qui contient les descriptions courtes intégrées que vous avez également créées plus tôt.
Vous comparerez un texte à ces descriptions intégrées afin d'identifier la description la plus similaire.
numpy a été importé en tant que np, et distance est disponible à partir de scipy.spatial. Une fonction create_embeddings() a déjà été définie pour vous et est disponible pour créer des embeddings à partir d'une seule entrée.
Cet exercice fait partie du cours
Introduction à l'intégration avec l'API OpenAI
Instructions
- Incorporez le texte,
"soap", à l'aide de votre fonction personnaliséecreate_embeddings()et extrayez une liste unique d'incorporations. - Calculez la distance en cosinus entre
query_embeddinget les encastrements dansproduct. - Trouvez et imprimez le site
'short_description'du produit le plus similaire au texte recherché en utilisant les distances cosinus dansdistances.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Embed the search text
search_text = "soap"
search_embedding = ____
distances = []
for product in products:
# Compute the cosine distance for each product description
dist = ____(search_embedding, ____)
distances.append(dist)
# Find and print the most similar product short_description
min_dist_ind = ____
print(____)