Je eerste AdaBoost-model
In de vorige les bouwde je modellen om de log-omzet van films te voorspellen. Je begon met een simpele lineaire regressie en kreeg een RMSE van 7.34. Daarna probeerde je dit te verbeteren met één iteratie van boosting, waarmee je een lagere RMSE van 7.28 behaalde.
In deze oefening bouw je je eerste AdaBoost-model — een AdaBoostRegressor — om de prestaties verder te verbeteren.
De movies-gegevensset is geladen en gesplitst in train- en testsets. Hier gebruik je de features 'budget' en 'popularity', die al voor je zijn gestandaardiseerd met StandardScaler() uit de module sklearn.preprocessing.
Deze oefening maakt deel uit van de cursus
Ensemblemethoden in Python
Oefeninstructies
- Instantieer het standaardmodel voor lineaire regressie.
- Bouw en fit een
AdaBoostRegressor, met de lineaire regressie als basismodel en12estimators. - Bereken de voorspellingen op de testset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Instantiate the default linear regression model
reg_lm = ____
# Build and fit an AdaBoost regressor
reg_ada = ____(____, ____, random_state=500)
reg_ada.fit(X_train, y_train)
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the RMSE
rmse = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE: {:.3f}'.format(rmse))