Tirer le meilleur parti d’AdaBoost
Comme vous l’avez vu, pour prédire les revenus des films, AdaBoost donne les meilleurs résultats avec des arbres de décision comme estimateur de base.
Dans cet exercice, vous allez préciser certains paramètres pour extraire encore plus de performance. En particulier, vous utiliserez un taux d’apprentissage plus faible pour des mises à jour plus progressives des hyperparamètres. En conséquence, le nombre d’estimateurs devra augmenter. De plus, les caractéristiques suivantes ont été ajoutées aux données : 'runtime', 'vote_average' et 'vote_count'.
Cet exercice fait partie du cours
<cours>Méthodes d’ensemble en Python</cours>Instructions de l’exercice
- Construisez un
AdaBoostRegressoravec100estimateurs et un taux d’apprentissage de0.01. - Ajustez
reg_adasur l’ensemble d’entraînement et calculez les prédictions sur l’ensemble de test.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Build and fit an AdaBoost regressor
reg_ada = ____(____, ____, random_state=500)
reg_ada.fit(X_train, y_train)
# Calculate the predictions on the test set
pred = ____
# Evaluate the performance using the RMSE
rmse = np.sqrt(mean_squared_error(y_test, pred))
print('RMSE: {:.3f}'.format(rmse))