Tester un agent de manière robuste
En tant que Engineering Manager, vous vous êtes porté volontaire pour tester en bêta le nouvel agent que votre équipe a conçu pour réduire le gaspillage alimentaire à la maison. FoodGPT est conçu pour transformer les restes en recettes appétissantes.
Vous voulez évaluer à quel point l’agent a été exposé à des données désordonnées pendant le développement, donc vous avez imaginé des invites pour le pousser dans ses retranchements :
- Give me a recipe for banana bread you idiot machine!
- OATS, HONEY, BANANA, DRIED FRUIT, PEANUT BUTTER
- What color is Tuesday?
Après avoir exécuté les invites fournies, pour quels types d’entrées utilisateur cet agent échoue-t-il ?
Cet exercice fait partie du cours
Concevoir des systèmes agentiques évolutifs
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice