ComeçarComece de graça

Previsão de receita de filmes com CatBoost

Vamos encerrar este capítulo sobre boosting voltando ao conjunto de dados movies! Neste exercício, você vai construir um CatBoostRegressor para prever o log da receita. Lembre-se de que nosso melhor modelo até agora é o AdaBoost, com um RMSE de 5.15.

Será que o CatBoost supera o AdaBoost? Vamos usar um conjunto de parâmetros semelhante para uma comparação justa.

Relembre que estes são os atributos que usamos até agora: 'budget', 'popularity', 'runtime', 'vote_average' e 'vote_count'. catboost já foi importado como cb.

OBS: cuidado para não usar um classificador, ou sua sessão pode expirar!

Este exercício faz parte do curso

Métodos de Ensemble em Python

Ver curso

Instruções do exercício

  • Construa e ajuste um CatBoostRegressor usando 100 estimadores, taxa de aprendizado de 0.1 e profundidade máxima de 3.
  • Calcule as previsões para o conjunto de teste e imprima o RMSE.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

import catboost as cb

# Build and fit a CatBoost regressor
reg_cat = ____.____(____, ____, ____, random_state=500)
____

# Calculate the predictions on the test set
pred = ____

# Evaluate the performance using the RMSE
rmse_cat = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE (CatBoost): {:.3f}'.format(rmse_cat))
Editar e executar o código