Ketika waktu penting — sedikit
Anda telah mempelajari bagaimana latensi yang dapat diterima dari layanan Machine Learning Anda akan memengaruhi pilihan mode penyajian yang akan Anda terapkan.
Terkadang pengguna bisa menunggu berhari-hari, bahkan berminggu-minggu. Terkadang, satu detik pun terlalu lama.
Semakin rendah latensi yang diharapkan, semakin besar tantangan rekayasa dan biaya layanan Anda. Oleh karena itu, hindari over-engineering dan selaraskan desain layanan ML Anda dengan kebutuhan pengguna dan kesediaan mereka untuk membayar.
Sebagai contoh, misalkan Anda membangun layanan ML untuk menganalisis dan meringkas dokumen .pdf berukuran besar. Jika pengguna Anda mengatakan ingin menerima keluaran dari layanan Anda dalam waktu 5 menit setelah membuat permintaan, mode penyajian yang paling masuk akal untuk use case Anda adalah:
Latihan ini adalah bagian dari kursus
Penyebaran dan Siklus Hidup MLOps
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga