Pickle
Sekarang saatnya Anda mendorong model pertama ke produksi. Ini adalah random forest classifier yang akan Anda gunakan sebagai baseline, sambil Anda terus mengembangkan alternatif yang lebih baik. Anda memiliki akses ke pembagian data train-test dengan nama baku, X_train, X_test, y_train, dan y_test, serta modul RandomForestClassifier() dan pickle, dengan metode .load() dan .dump() yang Anda perlukan untuk latihan ini.
Latihan ini merupakan bagian dari kursus
Merancang Alur Kerja Machine Learning di Python
Instruksi latihan
- Latih random forest classifier pada data. Tetapkan random seed ke 42 agar hasil Anda dapat direproduksi.
- Tulis model ke file menggunakan pickle. Buka file tujuan menggunakan sintaks
with open(____) as ____. - Sekarang muat model dari file ke nama variabel yang berbeda,
clf_from_file. - Simpan prediksi dari model yang Anda muat ke dalam variabel
preds.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Fit a random forest to the training set
clf = ____(____=42).____(
X_train, y_train)
# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
pickle.____(clf, file=file)
# Now load the model from file in the production environment
with ____ as file:
clf_from_file = pickle.____(file)
# Predict the labels of the test dataset
preds = clf_from_file.____