Model stacking II
Baik, berikut yang sudah Anda lakukan sejauh ini dalam implementasi stacking:
- Membagi data latih menjadi dua bagian
- Melatih beberapa model pada Bagian 1
- Membuat prediksi pada Bagian 2
- Membuat prediksi pada data uji
Sekarang, tujuan Anda adalah membuat model tingkat kedua dengan menggunakan prediksi dari langkah 3 dan 4 sebagai fitur. Jadi, model ini dilatih pada data Bagian 2 dan kemudian Anda dapat membuat prediksi stacking pada data uji.
DataFrame part_2 dan test sudah tersedia di ruang kerja Anda. Prediksi Gradient Boosting dan Random Forest disimpan di DataFrame tersebut masing-masing dengan nama "gb_pred" dan "rf_pred".
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Petunjuk latihan
- Latih model Linear Regression pada data Bagian 2 menggunakan prediksi model Gradient Boosting dan Random Forest sebagai fitur.
- Buat prediksi pada data uji menggunakan prediksi model Gradient Boosting dan Random Forest sebagai fitur.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.linear_model import LinearRegression
# Create linear regression model without the intercept
lr = LinearRegression(fit_intercept=False)
# Train 2nd level model on the Part 2 data
lr.____(part_2[['gb_pred', '____']], part_2.fare_amount)
# Make stacking predictions on the test data
test['stacking'] = lr.____(test[['gb_pred', '____']])
# Look at the model coefficients
print(lr.coef_)