LoslegenKostenlos loslegen

Vorhersage von Filmeinnahmen mit CatBoost

Schließen wir dieses Kapitel zu Boosting ab und kehren zum movies-Datensatz zurück! In dieser Übung baust du einen CatBoostRegressor, um den Log-Umsatz vorherzusagen. Denk daran: Unser bisher bestes Modell ist AdaBoost mit einem RMSE von 5.15.

Wird CatBoost AdaBoost schlagen? Wir verwenden eine ähnliche Menge an Parametern für einen fairen Vergleich.

Zur Erinnerung: Diese Features haben wir bisher verwendet: 'budget', 'popularity', 'runtime', 'vote_average' und 'vote_count'. catboost wurde bereits als cb importiert.

Hinweis: Achte darauf, keinen Classifier zu verwenden, sonst könnte deine Session ablaufen!

Diese Übung ist Teil des Kurses

Ensemble-Methoden in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle und fitte einen CatBoostRegressor mit 100 Estimators, einer Learning Rate von 0.1 und einer maximalen Tiefe von 3.
  • Berechne die Vorhersagen für den Testdatensatz und gib den RMSE aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

import catboost as cb

# Build and fit a CatBoost regressor
reg_cat = ____.____(____, ____, ____, random_state=500)
____

# Calculate the predictions on the test set
pred = ____

# Evaluate the performance using the RMSE
rmse_cat = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE (CatBoost): {:.3f}'.format(rmse_cat))
Code bearbeiten und ausführen