Boosting für prognostizierte Einnahmen

Das anfängliche Modell erreichte ein RMSE von etwa 7.34. Mal sehen, ob wir das mit einer Boosting-Iteration verbessern können.

Du baust eine weitere lineare Regression, aber diesmal sind die Zielwerte die Fehler des Basismodells, berechnet wie folgt:

y_train_error = pred_train - y_train
y_test_error = pred_test - y_test

Für dieses Modell verwendest du stattdessen das Feature 'popularity' in der Hoffnung, dass es informativere Muster liefert als das Feature 'budget' allein. Das steht dir als X_train_pop und X_test_pop zur Verfügung. Wie in der vorherigen Übung wurden die Eingabefeatures für dich standardisiert.

Diese Übung ist Teil des Kurses

<Kurs>Ensemble-Methoden in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Trainiere ein lineares Regressionsmodell auf den vorherigen Fehlern mit X_train_pop und y_train_error.
Berechne die vorhergesagten Fehler auf dem Testset X_test_pop.
Berechne das RMSE wie in der vorherigen Übung mit y_test_error und pred_error.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Fit a linear regression model to the previous errors
reg_error = LinearRegression()
____

# Calculate the predicted errors on the test set
pred_error = ____

# Evaluate the updated performance
rmse_error = ____
print('RMSE: {:.3f}'.format(rmse_error))

Code bearbeiten und ausführen