Utiliser l'entropie comme critère
Dans cet exercice, vous formerez un arbre de classification sur l'ensemble de données Wisconsin Breast Cancer en utilisant l'entropie comme critère d'information. Pour ce faire, vous utiliserez les 30 caractéristiques de l'ensemble de données, qui est divisé en 80 % de formation et 20 % de test.
X_train
ainsi que l'ensemble des étiquettes y_train
sont disponibles dans votre espace de travail.
Cet exercice fait partie du cours
Apprentissage automatique avec des modèles arborescents en Python
Instructions
Importez
DecisionTreeClassifier
à partir desklearn.tree
.Instanciez un site
DecisionTreeClassifier
dt_entropy
avec une profondeur maximale de 8.Fixez le critère d'information à
'entropy'
.Ajustez
dt_entropy
sur l'ensemble d'apprentissage.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____
# Instantiate dt_entropy, set 'entropy' as the information criterion
dt_entropy = ____(____=____, ____='____', random_state=1)
# Fit dt_entropy to the training set
____.____(____, ____)