Fixer des limites aux jetons
Une plateforme de commerce électronique vient de vous engager pour améliorer les performances de son bot de service à la clientèle construit à l'aide de l'API OpenAI. Vous avez décidé de commencer par vous assurer que les messages d'entrée ne posent pas de problème de limite de débit en fixant une limite de 100 tokens, et de la tester avec un exemple de message d'entrée.
La bibliothèque tiktoken
a été préchargée.
Cet exercice fait partie du cours
Développer des systèmes d'IA avec l'API OpenAI
Instructions
- Utilisez la bibliothèque
tiktoken
pour créer un encodage pour le modèlegpt-4o-mini
. - Vérifier le nombre de jetons attendus dans le message d'entrée.
- Imprimez la réponse si le message passe les deux contrôles.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
client = OpenAI(api_key="")
input_message = {"role": "user", "content": "I'd like to buy a shirt and a jacket. Can you suggest two color pairings for these items?"}
# Use tiktoken to create the encoding for your model
encoding = tiktoken.____(____)
# Check for the number of tokens
num_tokens = ____
# Run the chat completions function and print the response
if num_tokens <= ____:
response = client.chat.completions.create(model="gpt-4o-mini", messages=[input_message])
print(____)
else:
print("Message exceeds token limit")