MulaiMulai sekarang secara gratis

Validasi silang KFold

Saat bekerja dengan model ML, penting untuk mengevaluasi kinerjanya pada data yang tidak terlihat sebelumnya. Salah satu teknik umum untuk tujuan ini adalah k-fold cross-validation. Pada latihan ini, Anda akan mempelajari bagaimana teknik k-fold cross-validation membagi himpunan data menjadi himpunan latih dan uji. KFold sudah diimpor untuk Anda, begitu juga fitur himpunan data penyakit jantung heart_disease_df_X.

Latihan ini adalah bagian dari kursus

Machine Learning Ujung ke Ujung

Lihat Kursus

Petunjuk latihan

  • Buat objek KFold dengan n_splits=5, shuffle=True, dan random_state=42
  • Bagi data menggunakan kfold.split()
  • Cetak jumlah titik data pada pembagian train dan test

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)
Edit dan Jalankan Kode