Model stacking I
Sekarang saatnya melakukan stacking. Untuk menerapkan pendekatan stacking, Anda akan mengikuti 6 langkah yang telah kita bahas pada video sebelumnya:
- Bagi data train menjadi dua bagian
- Latih beberapa model pada Bagian 1
- Buat prediksi pada Bagian 2
- Buat prediksi pada data test
- Latih model baru pada Bagian 2 dengan menggunakan prediksi sebagai fitur
- Buat prediksi pada data test menggunakan model level ke-2
DataFrame train dan test sudah tersedia di ruang kerja Anda. features adalah daftar kolom yang akan digunakan untuk pelatihan pada data Bagian 1 dan juga telah tersedia di ruang kerja Anda. Nama variabel target adalah "fare_amount".
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor
# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)
# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)
# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)