Previsão de receita de filmes com CatBoost
Vamos encerrar este capítulo sobre boosting voltando ao conjunto de dados movies! Neste exercício, você vai construir um CatBoostRegressor para prever o log da receita. Lembre-se de que nosso melhor modelo até agora é o AdaBoost, com um RMSE de 5.15.
Será que o CatBoost supera o AdaBoost? Vamos usar um conjunto de parâmetros semelhante para uma comparação justa.
Relembre que estes são os atributos que usamos até agora: 'budget', 'popularity', 'runtime', 'vote_average' e 'vote_count'. catboost já foi importado como cb.
OBS: cuidado para não usar um classificador, ou sua sessão pode expirar!
Este exercício faz parte do curso
Métodos de Ensemble em Python
Instruções do exercício
- Construa e ajuste um
CatBoostRegressorusando100estimadores, taxa de aprendizado de0.1e profundidade máxima de3. - Calcule as previsões para o conjunto de teste e imprima o RMSE.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
import catboost as cb
# Build and fit a CatBoost regressor
reg_cat = ____.____(____, ____, ____, random_state=500)
____
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the RMSE
rmse_cat = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE (CatBoost): {:.3f}'.format(rmse_cat))