Préparer le terrain
Dans les exercices suivants, vous comparerez la précision de OOB à la précision de l'ensemble de test d'un classificateur de bagging formé sur l'ensemble de données Indian Liver Patient.
Dans sklearn, vous pouvez évaluer la précision OOB d'un classificateur d'ensemble en réglant le paramètre oob_score
sur True
lors de l'instanciation. Après l'apprentissage du classificateur, la précision de OOB peut être obtenue en accédant à l'attribut .oob_score_
de l'instance correspondante.
Dans votre environnement, nous avons mis à disposition la classe DecisionTreeClassifier
de sklearn.tree
.
Cet exercice fait partie du cours
Apprentissage automatique avec des modèles arborescents en Python
Instructions
Importez
BaggingClassifier
à partir desklearn.ensemble
.Instanciez un site
DecisionTreeClassifier
avecmin_samples_leaf
fixé à 8.Instanciez un site
BaggingClassifier
composé de 50 arbres et définissezoob_score
commeTrue
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import DecisionTreeClassifier
from sklearn.tree import DecisionTreeClassifier
# Import BaggingClassifier
____
# Instantiate dt
dt = ____(min_samples_leaf=____, random_state=1)
# Instantiate bc
bc = ____(base_estimator=____,
n_estimators=____,
oob_score=____,
random_state=1)