MulaiMulai sekarang secara gratis

Model stacking II

Baik, berikut yang sudah Anda lakukan sejauh ini dalam implementasi stacking:

  1. Membagi data latih menjadi dua bagian
  2. Melatih beberapa model pada Bagian 1
  3. Membuat prediksi pada Bagian 2
  4. Membuat prediksi pada data uji

Sekarang, tujuan Anda adalah membuat model tingkat kedua dengan menggunakan prediksi dari langkah 3 dan 4 sebagai fitur. Jadi, model ini dilatih pada data Bagian 2 dan kemudian Anda dapat membuat prediksi stacking pada data uji.

DataFrame part_2 dan test sudah tersedia di ruang kerja Anda. Prediksi Gradient Boosting dan Random Forest disimpan di DataFrame tersebut masing-masing dengan nama "gb_pred" dan "rf_pred".

Latihan ini adalah bagian dari kursus

Memenangi Kompetisi Kaggle dengan Python

Lihat Kursus

Petunjuk latihan

  • Latih model Linear Regression pada data Bagian 2 menggunakan prediksi model Gradient Boosting dan Random Forest sebagai fitur.
  • Buat prediksi pada data uji menggunakan prediksi model Gradient Boosting dan Random Forest sebagai fitur.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.linear_model import LinearRegression

# Create linear regression model without the intercept
lr = LinearRegression(fit_intercept=False)

# Train 2nd level model on the Part 2 data
lr.____(part_2[['gb_pred', '____']], part_2.fare_amount)

# Make stacking predictions on the test data
test['stacking'] = lr.____(test[['gb_pred', '____']])

# Look at the model coefficients
print(lr.coef_)
Edit dan Jalankan Kode