Vorhersage von Filmeinnahmen mit CatBoost
Schließen wir dieses Kapitel zu Boosting ab und kehren zum movies-Datensatz zurück! In dieser Übung baust du einen CatBoostRegressor, um den Log-Umsatz vorherzusagen. Denk daran: Unser bisher bestes Modell ist AdaBoost mit einem RMSE von 5.15.
Wird CatBoost AdaBoost schlagen? Wir verwenden eine ähnliche Menge an Parametern für einen fairen Vergleich.
Zur Erinnerung: Diese Features haben wir bisher verwendet: 'budget', 'popularity', 'runtime', 'vote_average' und 'vote_count'. catboost wurde bereits als cb importiert.
Hinweis: Achte darauf, keinen Classifier zu verwenden, sonst könnte deine Session ablaufen!
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Anleitung zur Übung
- Erstelle und fitte einen
CatBoostRegressormit100Estimators, einer Learning Rate von0.1und einer maximalen Tiefe von3. - Berechne die Vorhersagen für den Testdatensatz und gib den RMSE aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
import catboost as cb
# Build and fit a CatBoost regressor
reg_cat = ____.____(____, ____, ____, random_state=500)
____
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the RMSE
rmse_cat = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE (CatBoost): {:.3f}'.format(rmse_cat))