Boosting para receita prevista
O modelo inicial obteve uma RMSE de cerca de 7.34. Vamos ver se conseguimos melhorar isso usando uma iteração de boosting.
Você vai construir outra regressão linear, mas desta vez os valores-alvo são os erros do modelo base, calculados assim:
y_train_error = pred_train - y_train
y_test_error = pred_test - y_test
Para este modelo, você usará a variável 'popularity', esperando que ela forneça padrões mais informativos do que apenas a variável 'budget'. Elas estão disponíveis como X_train_pop e X_test_pop. Como no exercício anterior, as variáveis de entrada já foram padronizadas para você.
Este exercício faz parte do curso
Métodos de Ensemble em Python
Instruções do exercício
- Ajuste um modelo de regressão linear aos erros anteriores usando
X_train_popey_train_error. - Calcule os erros previstos no conjunto de teste,
X_test_pop. - Calcule a RMSE, como no exercício anterior, usando
y_test_errorepred_error.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit a linear regression model to the previous errors
reg_error = LinearRegression()
____
# Calculate the predicted errors on the test set
pred_error = ____
# Evaluate the updated performance
rmse_error = ____
print('RMSE: {:.3f}'.format(rmse_error))