Prediksi pendapatan film dengan CatBoost
Mari kita menutup bab tentang boosting dengan kembali ke himpunan data movies! Pada latihan ini, Anda akan membangun CatBoostRegressor untuk memprediksi log-pendapatan. Ingat bahwa model terbaik kita sejauh ini adalah model AdaBoost dengan RMSE 5.15.
Akankah CatBoost mengalahkan AdaBoost? Kita akan mencoba menggunakan seperangkat parameter yang serupa agar perbandingannya adil.
Ingat bahwa fitur yang telah kita gunakan sejauh ini adalah: 'budget', 'popularity', 'runtime', 'vote_average', dan 'vote_count'. catboost telah diimpor untuk Anda sebagai cb.
CATATAN: pastikan tidak menggunakan classifier, jika tidak sesi Anda dapat berakhir!
Latihan ini adalah bagian dari kursus
Metode Ensemble di Python
Petunjuk latihan
- Bangun dan latih
CatBoostRegressordengan100estimator, learning rate0.1, dan max depth3. - Hitung prediksi untuk himpunan data uji dan cetak nilai RMSE.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import catboost as cb
# Build and fit a CatBoost regressor
reg_cat = ____.____(____, ____, ____, random_state=500)
____
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the RMSE
rmse_cat = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE (CatBoost): {:.3f}'.format(rmse_cat))