Pickle
Sekarang saatnya Anda mendorong model pertama ke produksi. Ini adalah random forest classifier yang akan Anda gunakan sebagai baseline, sambil Anda terus mengembangkan alternatif yang lebih baik. Anda memiliki akses ke pembagian data train-test dengan nama baku, X_train, X_test, y_train, dan y_test, serta modul RandomForestClassifier() dan pickle, dengan metode .load() dan .dump() yang Anda perlukan untuk latihan ini.
Latihan ini adalah bagian dari kursus
Merancang Alur Kerja Machine Learning di Python
Petunjuk latihan
- Latih random forest classifier pada data. Tetapkan random seed ke 42 agar hasil Anda dapat direproduksi.
- Tulis model ke file menggunakan pickle. Buka file tujuan menggunakan sintaks
with open(____) as ____. - Sekarang muat model dari file ke nama variabel yang berbeda,
clf_from_file. - Simpan prediksi dari model yang Anda muat ke dalam variabel
preds.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit a random forest to the training set
clf = ____(____=42).____(
X_train, y_train)
# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
pickle.____(clf, file=file)
# Now load the model from file in the production environment
with ____ as file:
clf_from_file = pickle.____(file)
# Predict the labels of the test dataset
preds = clf_from_file.____