CommencerCommencer gratuitement

Explorer les hyperparamètres de Random Forest

Comprendre quels hyperparamètres sont disponibles et l’impact des différents réglages est une compétence clé pour tout data scientist. À mesure que les modèles deviennent plus complexes, les paramètres possibles se multiplient, mais seuls certains auront un impact important sur votre modèle.

Vous allez d’abord évaluer un modèle Random Forest existant (avec quelques mauvais choix d’hyperparamètres !) puis faire de meilleurs choix pour un nouveau modèle Random Forest et évaluer ses performances.

Vous avez à disposition :

  • les DataFrames X_train, X_test, y_train, y_test
  • un estimateur Random Forest pré-entraîné, rf_clf_old
  • les prédictions de cet estimateur sur le jeu de test, rf_old_predictions

Cet exercice fait partie du cours

Optimisation des hyperparamètres en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print out the old estimator, notice which hyperparameter is badly set
print(____)

# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
  	confusion_matrix(____, ____),
  	accuracy_score(____, ____))) 
Modifier et exécuter le code