Explorer les hyperparamètres de Random Forest
Comprendre quels hyperparamètres sont disponibles et l’impact des différents réglages est une compétence clé pour tout data scientist. À mesure que les modèles deviennent plus complexes, les paramètres possibles se multiplient, mais seuls certains auront un impact important sur votre modèle.
Vous allez d’abord évaluer un modèle Random Forest existant (avec quelques mauvais choix d’hyperparamètres !) puis faire de meilleurs choix pour un nouveau modèle Random Forest et évaluer ses performances.
Vous avez à disposition :
- les DataFrames
X_train,X_test,y_train,y_test - un estimateur Random Forest pré-entraîné,
rf_clf_old - les prédictions de cet estimateur sur le jeu de test,
rf_old_predictions
Cet exercice fait partie du cours
Optimisation des hyperparamètres en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))