MulaiMulai sekarang secara gratis

Skor validasi keseluruhan

Sekarang saatnya mendapatkan kinerja model yang sebenarnya menggunakan cross-validation! Bagaimana performa model prediksi permintaan item toko kita?

Tugas Anda adalah mengambil Mean Squared Error (MSE) untuk tiap lipatan (fold) secara terpisah, lalu menggabungkan hasil tersebut menjadi satu angka.

Untuk memudahkan, Anda diberikan fungsi get_fold_mse() yang untuk setiap pembagian cross-validation akan melatih model Random Forest dan mengembalikan daftar skor MSE per fold. get_fold_mse() menerima dua argumen: train dan objek TimeSeriesSplit.

Latihan ini adalah bagian dari kursus

Memenangi Kompetisi Kaggle dengan Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.model_selection import TimeSeriesSplit
import numpy as np

# Sort train data by date
train = train.sort_values('date')

# Initialize 3-fold time cross-validation
kf = ____(n_splits=____)

# Get MSE scores for each cross-validation split
mse_scores = get_fold_mse(train, kf)

print('Mean validation MSE: {:.5f}'.format(np.____(____)))
Edit dan Jalankan Kode