CommencerCommencer gratuitement

Créer des embeddings pour des descriptions de produits

On vous fournit une liste de dictionnaires appelée products, qui contient des informations sur différents produits vendus par un détaillant en ligne. Votre tâche est de créer l’embedding de la 'short_description' de chaque produit pour permettre la recherche sémantique sur le site du détaillant.

Voici un aperçu de la liste de dictionnaires products :

products = [
    {
        "title": "Smartphone X1",
        "short_description": "The latest flagship smartphone with AI-powered features and 5G connectivity.",
        "price": 799.99,
        "category": "Electronics",
        "features": [
            "6.5-inch AMOLED display",
            "Quad-camera system with 48MP main sensor",
            "Face recognition and fingerprint sensor",
            "Fast wireless charging"
        ]
    },
    ...
]

Un client OpenAI a déjà été créé et est disponible dans la variable client.

Cet exercice fait partie du cours

Introduction aux embeddings avec l’API OpenAI

Afficher le cours

Instructions

  • Créez une liste appelée product_descriptions contenant la 'short_description' de chaque produit dans products à l’aide d’une compréhension de liste.
  • Créez les embeddings de chaque 'short_description' de produit en utilisant le batching, en passant l’entrée au modèle text-embedding-3-small.
  • Extrayez les embeddings de chaque produit depuis response_dict et stockez-les dans products sous une nouvelle clé appelée 'embedding'.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Extract a list of product short descriptions from products
product_descriptions = [____ for product in ____]

# Create embeddings for each product description
response = ____
response_dict = response.model_dump()

# Extract the embeddings from response_dict and store in products
for i, product in ____:
    product['embedding'] = response_dict[____][____][____]
    
print(products[0].items())
Modifier et exécuter le code