Boosting per il fatturato previsto
Il modello iniziale ha ottenuto un RMSE di circa 7.34. Vediamo se riusciamo a migliorarlo con un’iterazione di boosting.
Costruirai un’altra regressione lineare, ma questa volta i valori target sono gli errori del modello base, calcolati così:
y_train_error = pred_train - y_train
y_test_error = pred_test - y_test
Per questo modello userai invece la caratteristica 'popularity', sperando che fornisca schemi più informativi rispetto alla sola 'budget'. La hai a disposizione come X_train_pop e X_test_pop. Come nell’esercizio precedente, le caratteristiche in input sono già state standardizzate per te.
Questo esercizio fa parte del corso
Metodi Ensemble in Python
Istruzioni dell'esercizio
- Adestra un modello di regressione lineare sugli errori precedenti usando
X_train_popey_train_error. - Calcola gli errori previsti sul set di test,
X_test_pop. - Calcola l’RMSE, come nell’esercizio precedente, usando
y_test_errorepred_error.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit a linear regression model to the previous errors
reg_error = LinearRegression()
____
# Calculate the predicted errors on the test set
pred_error = ____
# Evaluate the updated performance
rmse_error = ____
print('RMSE: {:.3f}'.format(rmse_error))