Créer des embeddings pour des descriptions de produits
On vous fournit une liste de dictionnaires appelée products, qui contient des informations sur différents produits vendus par un détaillant en ligne. Votre tâche est de créer l’embedding de la 'short_description' de chaque produit pour permettre la recherche sémantique sur le site du détaillant.
Voici un aperçu de la liste de dictionnaires products :
products = [
{
"title": "Smartphone X1",
"short_description": "The latest flagship smartphone with AI-powered features and 5G connectivity.",
"price": 799.99,
"category": "Electronics",
"features": [
"6.5-inch AMOLED display",
"Quad-camera system with 48MP main sensor",
"Face recognition and fingerprint sensor",
"Fast wireless charging"
]
},
...
]
Un client OpenAI a déjà été créé et est disponible dans la variable client.
Cet exercice fait partie du cours
Introduction aux embeddings avec l’API OpenAI
Instructions
- Créez une liste appelée
product_descriptionscontenant la'short_description'de chaque produit dansproductsà l’aide d’une compréhension de liste. - Créez les embeddings de chaque
'short_description'de produit en utilisant le batching, en passant l’entrée au modèletext-embedding-3-small. - Extrayez les embeddings de chaque produit depuis
response_dictet stockez-les dansproductssous une nouvelle clé appelée'embedding'.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract a list of product short descriptions from products
product_descriptions = [____ for product in ____]
# Create embeddings for each product description
response = ____
response_dict = response.model_dump()
# Extract the embeddings from response_dict and store in products
for i, product in ____:
product['embedding'] = response_dict[____][____][____]
print(products[0].items())