Cuando el tiempo importa... un poco
Has aprendido cómo la latencia aceptable de tu servicio de Machine Learning influye en la elección del modo de servicio que implementarás.
A veces las personas usuarias pueden esperar días, incluso semanas. Otras veces, un segundo es demasiado.
Cuanto menor sea la latencia esperada, mayores serán los retos de ingeniería y el coste de tu servicio. Por lo tanto, evita el sobreingeniería y ajusta el diseño de tu servicio de ML a lo que las personas usuarias necesitan y están dispuestas a pagar.
Por ejemplo, imagina que estás creando un servicio de ML para analizar y resumir documentos .pdf grandes. Si tus usuarios te dicen que les gustaría recibir los resultados de tu servicio en los 5 minutos posteriores a hacer la solicitud, el modo de servicio más razonable para tu caso de uso sería:
Este ejercicio forma parte del curso
Despliegue y ciclo de vida en MLOps
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio