CommencerCommencer gratuitement

Préparez le terrain

Dans les exercices suivants, vous comparerez la précision OOB à la précision du jeu de test d'un classificateur bagging formé sur l'ensemble de données Indian Liver Patient.

Dans sklearn, il est possible d'évaluer la précision OOB d'un classificateur d'ensemble en définissant le paramètre oob_score sur True lors de l'instanciation. Après avoir formé le classificateur, la précision OOB peut être obtenue en accédant à l'attribut « .oob_score_ » (précision hors échantillon) à partir de l'instance correspondante.

Dans votre environnement, nous avons mis à disposition la classe DecisionTreeClassifier à partir de sklearn.tree.

Cet exercice fait partie du cours

Machine learning avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Importez BaggingClassifier à partir de sklearn.ensemble.

  • Instancier un objet DecisionTreeClassifier avec min_samples_leaf défini sur 8.

  • Instanciez une classe BaggingClassifier composée de 50 arbres et définissez oob_score sur True.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import DecisionTreeClassifier
from sklearn.tree import DecisionTreeClassifier

# Import BaggingClassifier
____

# Instantiate dt
dt = ____(min_samples_leaf=____, random_state=1)

# Instantiate bc
bc = ____(base_estimator=____, 
            n_estimators=____,
            oob_score=____,
            random_state=1)
Modifier et exécuter le code