MulaiMulai sekarang secara gratis

Blending model

Anda akan mulai membuat ensemble model dengan teknik blending.

Tujuan Anda adalah melatih 2 model berbeda pada data kompetisi New York City Taxi. Buat prediksi pada data uji, lalu gabungkan keduanya menggunakan rata-rata aritmetika sederhana.

DataFrame train dan test sudah tersedia di ruang kerja Anda. features adalah daftar kolom yang digunakan untuk pelatihan dan juga sudah tersedia. Nama variabel target adalah "fare_amount".

Latihan ini adalah bagian dari kursus

Memenangi Kompetisi Kaggle dengan Python

Lihat Kursus

Petunjuk latihan

  • Latih model Gradient Boosting pada data train menggunakan daftar features, dan kolom "fare_amount" sebagai variabel target.
  • Latih model Random Forest dengan cara yang sama.
  • Buat prediksi pada data test menggunakan kedua model Gradient Boosting dan Random Forest.
  • Cari rata-rata dari prediksi kedua model.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])

# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))
Edit dan Jalankan Kode