LoslegenKostenlos loslegen

Trainiere deinen ersten Klassifikationsbaum

In dieser Übung arbeitest du mit dem Wisconsin Breast Cancer Dataset aus dem UCI Machine Learning Repository. Du sagst vorher, ob ein Tumor bösartig (malignant) oder gutartig (benign) ist, basierend auf zwei Merkmalen: dem mittleren Radius des Tumors (radius_mean) und der mittleren Anzahl konkaver Punkte (concave points_mean).

Der Datensatz ist bereits in deinem Workspace geladen und in 80 % Training und 20 % Test aufgeteilt. Die Merkmalmatrizen sind X_train und X_test zugewiesen, die Label-Arrays y_train und y_test, wobei Klasse 1 einem bösartigen Tumor und Klasse 0 einem gutartigen Tumor entspricht. Um reproduzierbare Ergebnisse zu erhalten, haben wir außerdem eine Variable SEED definiert, die auf 1 gesetzt ist.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere DecisionTreeClassifier aus sklearn.tree.

  • Instanziiere einen DecisionTreeClassifier dt mit einer maximalen Tiefe von 6.

  • Fitte dt auf den Trainingssatz.

  • Sage die Testlabels vorher und weise das Ergebnis y_pred zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____

# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)

# Fit dt to the training set
____.____(____, ____)

# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])
Code bearbeiten und ausführen