Préparez le terrain
Dans les exercices suivants, vous comparerez la précision OOB à la précision du jeu de test d'un classificateur bagging formé sur l'ensemble de données Indian Liver Patient.
Dans sklearn, il est possible d'évaluer la précision OOB d'un classificateur d'ensemble en définissant le paramètre oob_score sur True lors de l'instanciation. Après avoir formé le classificateur, la précision OOB peut être obtenue en accédant à l'attribut « .oob_score_ » (précision hors échantillon) à partir de l'instance correspondante.
Dans votre environnement, nous avons mis à disposition la classe DecisionTreeClassifier à partir de sklearn.tree.
Cet exercice fait partie du cours
Machine learning avec des modèles arborescents en Python
Instructions
Importez
BaggingClassifierà partir desklearn.ensemble.Instancier un objet
DecisionTreeClassifieravecmin_samples_leafdéfini sur 8.Instanciez une classe
BaggingClassifiercomposée de 50 arbres et définissezoob_scoresurTrue.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import DecisionTreeClassifier
from sklearn.tree import DecisionTreeClassifier
# Import BaggingClassifier
____
# Instantiate dt
dt = ____(min_samples_leaf=____, random_state=1)
# Instantiate bc
bc = ____(base_estimator=____,
n_estimators=____,
oob_score=____,
random_state=1)