Quand le temps compte… un peu
Vous avez vu à quel point la latence acceptable de votre service de Machine Learning influence le choix du mode de service à mettre en place.
Parfois, les utilisateurs peuvent attendre des jours, voire des semaines. Parfois, une seconde, c’est déjà trop.
Plus la latence attendue est faible, plus les défis d’ingénierie et le coût de votre service augmentent. Évitez donc la sur‑ingénierie et alignez la conception de votre service ML sur ce que les utilisateurs exigent et sont prêts à payer.
Par exemple, imaginons que vous construisiez un service ML d’analyse et de synthèse de gros fichiers .pdf. Si vos utilisateurs vous indiquent qu’ils souhaitent recevoir les résultats dans les 5 minutes suivant leur requête, le mode de service le plus raisonnable pour votre cas d’usage serait :
Cet exercice fait partie du cours
Déploiement MLOps et cycle de vie
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice