Validasi silang KFold
Saat bekerja dengan model ML, penting untuk mengevaluasi kinerjanya pada data yang tidak terlihat sebelumnya. Salah satu teknik umum untuk tujuan ini adalah k-fold cross-validation. Pada latihan ini, Anda akan mempelajari bagaimana teknik k-fold cross-validation membagi himpunan data menjadi himpunan latih dan uji. KFold sudah diimpor untuk Anda, begitu juga fitur himpunan data penyakit jantung heart_disease_df_X.
Latihan ini adalah bagian dari kursus
Machine Learning Ujung ke Ujung
Petunjuk latihan
- Buat objek KFold dengan
n_splits=5,shuffle=True, danrandom_state=42 - Bagi data menggunakan
kfold.split() - Cetak jumlah titik data pada pembagian train dan test
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a KFold object
kfold = ____(____, ____, ____)
# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))
# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)