ComenzarEmpieza gratis

Cuando el tiempo importa... un poco

Has aprendido cómo la latencia aceptable de tu servicio de Machine Learning influye en la elección del modo de servicio que implementarás.

A veces las personas usuarias pueden esperar días, incluso semanas. Otras veces, un segundo es demasiado.

Cuanto menor sea la latencia esperada, mayores serán los retos de ingeniería y el coste de tu servicio. Por lo tanto, evita el sobreingeniería y ajusta el diseño de tu servicio de ML a lo que las personas usuarias necesitan y están dispuestas a pagar.

Por ejemplo, imagina que estás creando un servicio de ML para analizar y resumir documentos .pdf grandes. Si tus usuarios te dicen que les gustaría recibir los resultados de tu servicio en los 5 minutos posteriores a hacer la solicitud, el modo de servicio más razonable para tu caso de uso sería:

Este ejercicio forma parte del curso

Despliegue y ciclo de vida en MLOps

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio