CommencerCommencez gratuitement

Utilisation de l'entropie comme critère

Dans cet exercice, vous allez entraîner un arbre de classification sur l'ensemble de données Wisconsin Breast Cancer en utilisant l'entropie comme critère d'information. Vous utiliserez pour cela les 30 caractéristiques du jeu de données, qui est divisé en 80 % d'entraînement et 20 % de test.

X_train ainsi que la gamme d'étiquettes y_train sont disponibles dans votre espace de travail.

Cet exercice fait partie du cours

<cours>Machine learning avec des modèles arborescents en Python</cours>
Voir le cours

Instructions de l’exercice

  • Importez DecisionTreeClassifier à partir de sklearn.tree.

  • Créez une instance DecisionTreeClassifier dt_entropy, avec une profondeur maximale de 8.

  • Définissez le critère d'information sur 'entropy'.

  • Ajustez dt_entropy sur l'ensemble d'apprentissage.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____

# Instantiate dt_entropy, set 'entropy' as the information criterion
dt_entropy = ____(____=____, ____='____', random_state=1)

# Fit dt_entropy to the training set
____.____(____, ____)
Modifier et exécuter le code