Boosting für prognostizierte Einnahmen
Das anfängliche Modell erreichte ein RMSE von etwa 7.34. Mal sehen, ob wir das mit einer Boosting-Iteration verbessern können.
Du baust eine weitere lineare Regression, aber diesmal sind die Zielwerte die Fehler des Basismodells, berechnet wie folgt:
y_train_error = pred_train - y_train
y_test_error = pred_test - y_test
Für dieses Modell verwendest du stattdessen das Feature 'popularity' in der Hoffnung, dass es informativere Muster liefert als das Feature 'budget' allein. Das steht dir als X_train_pop und X_test_pop zur Verfügung. Wie in der vorherigen Übung wurden die Eingabefeatures für dich standardisiert.
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Anleitung zur Übung
- Trainiere ein lineares Regressionsmodell auf den vorherigen Fehlern mit
X_train_popundy_train_error. - Berechne die vorhergesagten Fehler auf dem Testset
X_test_pop. - Berechne das RMSE wie in der vorherigen Übung mit
y_test_errorundpred_error.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit a linear regression model to the previous errors
reg_error = LinearRegression()
____
# Calculate the predicted errors on the test set
pred_error = ____
# Evaluate the updated performance
rmse_error = ____
print('RMSE: {:.3f}'.format(rmse_error))