1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Kubernetes

Connected

Bài tập

Một quy trình làm việc MLOps

Bài tập này tập trung vào việc áp dụng một số khái niệm Kubernetes vào quy trình làm việc MLOps.

Đội data science tại công ty của bạn dùng một thuật toán để phát hiện các giá trị bất thường (outlier) trong chuỗi thời gian từ một thiết bị IoT. Thuật toán này liên tục được cải tiến, dẫn đến những thay đổi thường xuyên và tạo ra các phiên bản mới của image Docker tương ứng. Nhiệm vụ của bạn là hỗ trợ đưa các thuật toán này vào sản xuất, giúp đội data science kiểm thử hiệu năng của từng phiên bản.

Những thứ sau đã được chuẩn bị:

  • Dữ liệu thực tế để chạy thuật toán phát hiện (data.csv), sẽ được chép vào một image Docker
  • Hai phiên bản khác nhau của thuật toán phát hiện outlier (detect_outliers_*.py)
  • Hai Dockerfile để tạo hai image chứa các phiên bản khác nhau này (Dockerfile.outlier_detection_*)
  • Một script bash để chuẩn bị và tải các image lên (01_images.sh)
  • Một Kubernetes Manifest tên là 02_pods_outlier-detection.yml, bạn sẽ dùng để triển khai các thuật toán phát hiện outlier.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Dành chút thời gian xem các Dockerfile (ví dụ dùng cat). Lần này bạn sẽ thấy dữ liệu được đóng gói cùng với các phiên bản phát hiện outlier khác nhau vào các image docker tương ứng.
  • Build các Docker image và tải lên cluster Kubernetes của bạn bằng lệnh bash chạy script 01_images.sh.