Entropie als Kriterium verwenden
In dieser Übung trainierst du einen Klassifizierungsbaum für den Wisconsin-Brustkrebs-Datensatz und nutzt dabei die Entropie als Informationskriterium. Dazu verwendest du alle 30 Merkmale des Datensatzes, der in 80 % Trainings- und 20 % Testdaten aufgeteilt ist.
X_train
sowie die Reihe der Etiketten y_train
sind in deinem Arbeitsbereich verfügbar.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Importiere
DecisionTreeClassifier
vonsklearn.tree
.Instanziere eine
DecisionTreeClassifier
dt_entropy
mit einer maximalen Tiefe von 8.Setze das Informationskriterium auf
'entropy'
.Passe
dt_entropy
an das Trainingsset an.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____
# Instantiate dt_entropy, set 'entropy' as the information criterion
dt_entropy = ____(____=____, ____='____', random_state=1)
# Fit dt_entropy to the training set
____.____(____, ____)