Aan de slagGa gratis aan de slag

Je eerste AdaBoost-model

In de vorige les bouwde je modellen om de log-omzet van films te voorspellen. Je begon met een simpele lineaire regressie en kreeg een RMSE van 7.34. Daarna probeerde je dit te verbeteren met één iteratie van boosting, waarmee je een lagere RMSE van 7.28 behaalde.

In deze oefening bouw je je eerste AdaBoost-model — een AdaBoostRegressor — om de prestaties verder te verbeteren.

De movies-gegevensset is geladen en gesplitst in train- en testsets. Hier gebruik je de features 'budget' en 'popularity', die al voor je zijn gestandaardiseerd met StandardScaler() uit de module sklearn.preprocessing.

Deze oefening maakt deel uit van de cursus

Ensemblemethoden in Python

Cursus bekijken

Oefeninstructies

  • Instantieer het standaardmodel voor lineaire regressie.
  • Bouw en fit een AdaBoostRegressor, met de lineaire regressie als basismodel en 12 estimators.
  • Bereken de voorspellingen op de testset.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Instantiate the default linear regression model
reg_lm = ____

# Build and fit an AdaBoost regressor
reg_ada = ____(____, ____, random_state=500)
reg_ada.fit(X_train, y_train)

# Calculate the predictions on the test set
pred = ____

# Evaluate the performance using the RMSE
rmse = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE: {:.3f}'.format(rmse))
Code bewerken en uitvoeren