MulaiMulai sekarang secara gratis

Prediksi pendapatan film dengan CatBoost

Mari kita menutup bab tentang boosting dengan kembali ke himpunan data movies! Pada latihan ini, Anda akan membangun CatBoostRegressor untuk memprediksi log-pendapatan. Ingat bahwa model terbaik kita sejauh ini adalah model AdaBoost dengan RMSE 5.15.

Akankah CatBoost mengalahkan AdaBoost? Kita akan mencoba menggunakan seperangkat parameter yang serupa agar perbandingannya adil.

Ingat bahwa fitur yang telah kita gunakan sejauh ini adalah: 'budget', 'popularity', 'runtime', 'vote_average', dan 'vote_count'. catboost telah diimpor untuk Anda sebagai cb.

CATATAN: pastikan tidak menggunakan classifier, jika tidak sesi Anda dapat berakhir!

Latihan ini adalah bagian dari kursus

Metode Ensemble di Python

Lihat Kursus

Petunjuk latihan

  • Bangun dan latih CatBoostRegressor dengan 100 estimator, learning rate 0.1, dan max depth 3.
  • Hitung prediksi untuk himpunan data uji dan cetak nilai RMSE.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

import catboost as cb

# Build and fit a CatBoost regressor
reg_cat = ____.____(____, ____, ____, random_state=500)
____

# Calculate the predictions on the test set
pred = ____

# Evaluate the performance using the RMSE
rmse_cat = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE (CatBoost): {:.3f}'.format(rmse_cat))
Edit dan Jalankan Kode