Trainiere deinen ersten Klassifikationsbaum
In dieser Übung arbeitest du mit dem Wisconsin Breast Cancer Dataset aus dem UCI Machine Learning Repository. Du sagst vorher, ob ein Tumor bösartig (malignant) oder gutartig (benign) ist, basierend auf zwei Merkmalen: dem mittleren Radius des Tumors (radius_mean) und der mittleren Anzahl konkaver Punkte (concave points_mean).
Der Datensatz ist bereits in deinem Workspace geladen und in 80 % Training und 20 % Test aufgeteilt. Die Merkmalmatrizen sind X_train und X_test zugewiesen, die Label-Arrays y_train und y_test, wobei Klasse 1 einem bösartigen Tumor und Klasse 0 einem gutartigen Tumor entspricht. Um reproduzierbare Ergebnisse zu erhalten, haben wir außerdem eine Variable SEED definiert, die auf 1 gesetzt ist.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Importiere
DecisionTreeClassifieraussklearn.tree.Instanziiere einen
DecisionTreeClassifierdtmit einer maximalen Tiefe von 6.Fitte
dtauf den Trainingssatz.Sage die Testlabels vorher und weise das Ergebnis
y_predzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____
# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)
# Fit dt to the training set
____.____(____, ____)
# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])