CommencerCommencer gratuitement

Quand le temps compte… un peu

Vous avez vu à quel point la latence acceptable de votre service de Machine Learning influence le choix du mode de service à mettre en place.

Parfois, les utilisateurs peuvent attendre des jours, voire des semaines. Parfois, une seconde, c’est déjà trop.

Plus la latence attendue est faible, plus les défis d’ingénierie et le coût de votre service augmentent. Évitez donc la sur‑ingénierie et alignez la conception de votre service ML sur ce que les utilisateurs exigent et sont prêts à payer.

Par exemple, imaginons que vous construisiez un service ML d’analyse et de synthèse de gros fichiers .pdf. Si vos utilisateurs vous indiquent qu’ils souhaitent recevoir les résultats dans les 5 minutes suivant leur requête, le mode de service le plus raisonnable pour votre cas d’usage serait :

Cet exercice fait partie du cours

Déploiement MLOps et cycle de vie

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice