Blending model
Anda akan mulai membuat ensemble model dengan teknik blending.
Tujuan Anda adalah melatih 2 model berbeda pada data kompetisi New York City Taxi. Buat prediksi pada data uji, lalu gabungkan keduanya menggunakan rata-rata aritmetika sederhana.
DataFrame train dan test sudah tersedia di ruang kerja Anda. features adalah daftar kolom yang digunakan untuk pelatihan dan juga sudah tersedia. Nama variabel target adalah "fare_amount".
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Petunjuk latihan
- Latih model Gradient Boosting pada data train menggunakan daftar
features, dan kolom "fare_amount" sebagai variabel target. - Latih model Random Forest dengan cara yang sama.
- Buat prediksi pada data test menggunakan kedua model Gradient Boosting dan Random Forest.
- Cari rata-rata dari prediksi kedua model.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor
# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)
# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)
# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])
# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))