1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Pickle

Cuối cùng cũng đến lúc bạn đưa mô hình đầu tiên vào sản xuất. Đây là một random forest classifier mà bạn sẽ dùng làm đường cơ sở trong khi vẫn tiếp tục phát triển một phương án tốt hơn. Bạn có sẵn dữ liệu đã được chia train/test với các tên quen thuộc: X_train, X_test, y_train và y_test, cùng các mô-đun RandomForestClassifier() và pickle, với các phương thức .load() và .dump() mà bạn sẽ cần cho bài tập này.

Hướng dẫn

100 XP
  • Huấn luyện một random forest classifier trên dữ liệu. Cố định hạt giống ngẫu nhiên là 42 để đảm bảo kết quả có thể tái lập.
  • Ghi mô hình ra tệp bằng pickle. Mở tệp đích bằng cú pháp with open(____) as ____.
  • Bây giờ hãy tải mô hình từ tệp vào một tên biến khác, clf_from_file.
  • Lưu các dự đoán từ mô hình bạn vừa tải vào biến preds.