Kembali ke regresi dengan stacking
Pada Bab 1, kita memperlakukan rating aplikasi sebagai masalah regresi, memprediksi rating pada interval 1 hingga 5. Sejauh ini di bab ini, kita menanganinya sebagai masalah klasifikasi, dengan membulatkan rating ke bilangan bulat terdekat. Untuk berlatih menggunakan StackingRegressor, kita akan kembali ke pendekatan regresi.
Seperti biasa, fitur masukan telah distandardisasi untuk Anda dengan StandardScaler().
MAE (mean absolute error) adalah metrik evaluasi. Pada Bab 1, MAE sekitar 0.61. Mari kita lihat apakah metode stacking ensemble dapat mengurangi galat tersebut.
Latihan ini adalah bagian dari kursus
Metode Ensemble di Python
Petunjuk latihan
- Instansiasi decision tree regressor dengan:
min_samples_leaf = 11danmin_samples_split = 33. - Instansiasi linear regression bawaan (default).
- Instansiasi model regresi
Ridgedenganrandom_state = 500. - Bangun dan latih
StackingRegressor, dengan meneruskanregressorsdanmeta_regressor.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Instantiate the 1st-layer regressors
reg_dt = ____(____, ____, random_state=500)
reg_lr = ____
reg_ridge = ____
# Instantiate the 2nd-layer regressor
reg_meta = LinearRegression()
# Build the Stacking regressor
reg_stack = ____
reg_stack.____
# Evaluate the performance on the test set using the MAE metric
pred = reg_stack.predict(X_test)
print('MAE: {:.3f}'.format(mean_absolute_error(y_test, pred)))