Boosting para receita prevista

O modelo inicial obteve uma RMSE de cerca de 7.34. Vamos ver se conseguimos melhorar isso usando uma iteração de boosting.

Você vai construir outra regressão linear, mas desta vez os valores-alvo são os erros do modelo base, calculados assim:

y_train_error = pred_train - y_train
y_test_error = pred_test - y_test

Para este modelo, você usará a variável 'popularity', esperando que ela forneça padrões mais informativos do que apenas a variável 'budget'. Elas estão disponíveis como X_train_pop e X_test_pop. Como no exercício anterior, as variáveis de entrada já foram padronizadas para você.

Este exercicio faz parte do curso

Métodos de Ensemble em Python

Ver curso

Instruções do exercicio

Ajuste um modelo de regressão linear aos erros anteriores usando X_train_pop e y_train_error.
Calcule os erros previstos no conjunto de teste, X_test_pop.
Calcule a RMSE, como no exercício anterior, usando y_test_error e pred_error.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Fit a linear regression model to the previous errors
reg_error = LinearRegression()
____

# Calculate the predicted errors on the test set
pred_error = ____

# Evaluate the updated performance
rmse_error = ____
print('RMSE: {:.3f}'.format(rmse_error))

Editar e Executar Código