Skor validasi keseluruhan
Sekarang saatnya mendapatkan kinerja model yang sebenarnya menggunakan cross-validation! Bagaimana performa model prediksi permintaan item toko kita?
Tugas Anda adalah mengambil Mean Squared Error (MSE) untuk tiap lipatan (fold) secara terpisah, lalu menggabungkan hasil tersebut menjadi satu angka.
Untuk memudahkan, Anda diberikan fungsi get_fold_mse() yang untuk setiap pembagian cross-validation akan melatih model Random Forest dan mengembalikan daftar skor MSE per fold. get_fold_mse() menerima dua argumen: train dan objek TimeSeriesSplit.
Latihan ini merupakan bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
from sklearn.model_selection import TimeSeriesSplit
import numpy as np
# Sort train data by date
train = train.sort_values('date')
# Initialize 3-fold time cross-validation
kf = ____(n_splits=____)
# Get MSE scores for each cross-validation split
mse_scores = get_fold_mse(train, kf)
print('Mean validation MSE: {:.5f}'.format(np.____(____)))