CommencerCommencez gratuitement

Préparer le terrain

Dans les exercices suivants, vous comparerez la précision OOB à la précision du jeu de test d'un classificateur bagging formé sur l'ensemble de données Patients hépatiques indiens.

Dans sklearn, il est possible d'évaluer la précision OOB d'un classificateur d'ensemble en définissant le paramètre oob_score sur True lors de l'instanciation. Après avoir formé le classificateur, la précision OOB peut être obtenue en accédant à l'attribut .oob_score_ à partir de l'instance correspondante.

Dans votre environnement, nous avons mis à disposition la classe DecisionTreeClassifier à partir de sklearn.tree.

Cet exercice fait partie du cours

<cours>Machine learning avec des modèles arborescents en Python</cours>
Voir le cours

Instructions de l’exercice

  • Importez BaggingClassifier à partir de sklearn.ensemble.

  • Instanciez un DecisionTreeClassifier avec min_samples_leaf défini sur 8.

  • Instanciez un BaggingClassifier composé de 50 arbres et définissez oob_score sur True.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import DecisionTreeClassifier
from sklearn.tree import DecisionTreeClassifier

# Import BaggingClassifier
____

# Instantiate dt
dt = ____(min_samples_leaf=____, random_state=1)

# Instantiate bc
bc = ____(base_estimator=____, 
            n_estimators=____,
            oob_score=____,
            random_state=1)
Modifier et exécuter le code