Pelatihan dengan bootstrapping
Sekarang mari kita membangun pengklasifikasi pohon keputusan "lemah" dan melatihnya pada sampel dari himpunan data latih yang diambil dengan pengembalian (with replacement). Ini akan membantu Anda memahami apa yang terjadi pada setiap iterasi dari sebuah ansambel bagging.
Untuk mengambil sampel, Anda akan menggunakan metode pandas .sample() yang memiliki parameter replace. Sebagai contoh, baris kode berikut melakukan sampling dengan pengembalian dari seluruh DataFrame df:
df.sample(frac=1.0, replace=True, random_state=42)
Latihan ini adalah bagian dari kursus
Metode Ensemble di Python
Petunjuk latihan
- Ambil sampel dengan pengembalian (
replace=True) dari seluruh (frac=1.0) himpunan data latih,X_train. - Bangun pengklasifikasi pohon keputusan menggunakan parameter
max_depth = 4. - Fit model ke data latih hasil sampel.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Take a sample with replacement
X_train_sample = X_train.____(____, ____, random_state=42)
y_train_sample = y_train.loc[X_train_sample.index]
# Build a "weak" Decision Tree classifier
clf = ____(____, random_state=500)
# Fit the model to the training sample
____