MulaiMulai sekarang secara gratis

Pelatihan dengan bootstrapping

Sekarang mari kita membangun pengklasifikasi pohon keputusan "lemah" dan melatihnya pada sampel dari himpunan data latih yang diambil dengan pengembalian (with replacement). Ini akan membantu Anda memahami apa yang terjadi pada setiap iterasi dari sebuah ansambel bagging.

Untuk mengambil sampel, Anda akan menggunakan metode pandas .sample() yang memiliki parameter replace. Sebagai contoh, baris kode berikut melakukan sampling dengan pengembalian dari seluruh DataFrame df:

df.sample(frac=1.0, replace=True, random_state=42)

Latihan ini adalah bagian dari kursus

Metode Ensemble di Python

Lihat Kursus

Petunjuk latihan

  • Ambil sampel dengan pengembalian (replace=True) dari seluruh (frac=1.0) himpunan data latih, X_train.
  • Bangun pengklasifikasi pohon keputusan menggunakan parameter max_depth = 4.
  • Fit model ke data latih hasil sampel.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Take a sample with replacement
X_train_sample = X_train.____(____, ____, random_state=42)
y_train_sample = y_train.loc[X_train_sample.index]

# Build a "weak" Decision Tree classifier
clf = ____(____, random_state=500)

# Fit the model to the training sample
____
Edit dan Jalankan Kode