MulaiMulai sekarang secara gratis

KFold() di scikit-learn

Anda baru saja menjalankan kode rekan kerja yang membuat model random forest dan menghitung akurasi out-of-sample. Anda melihat bahwa kode rekan Anda tidak menyetel random state, dan kesalahan yang Anda temukan sama sekali berbeda dari yang dilaporkan rekan Anda.

Untuk mendapatkan perkiraan yang lebih baik tentang seberapa akurat model random forest ini pada data baru, Anda memutuskan untuk menghasilkan beberapa indeks untuk digunakan pada KFold cross-validation.

Latihan ini adalah bagian dari kursus

Validasi Model di Python

Lihat Kursus

Petunjuk latihan

  • Panggil metode KFold() untuk membagi data menggunakan lima split, dengan pengacakan (shuffle), dan random state 1111.
  • Gunakan metode split() dari KFold pada X.
  • Cetak jumlah indeks pada daftar indeks train dan validation.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.model_selection import KFold

# Use KFold
kf = KFold(____, ____, ____)

# Create splits
splits = kf.____(____)

# Print the number of indices
for train_index, val_index in splits:
    print("Number of training indices: %s" % len(____))
    print("Number of validation indices: %s" % len(____))
Edit dan Jalankan Kode