Eingeschränkte und uneingeschränkte Entscheidungsbäume

In dieser Übung greifen wir das Pokémon-Datenset aus dem letzten Kapitel wieder auf. Ziel ist es, vorherzusagen, ob ein gegebenes Pokémon legendär ist oder nicht.

Du wirst zwei separate Decision-Tree-Klassifikatoren bauen. Im ersten gibst du die Parameter min_samples_leaf und min_samples_split an, aber keine maximale Tiefe, sodass sich der Baum ohne Einschränkungen vollständig entwickeln kann.

Im zweiten legst du Einschränkungen fest, indem du die Tiefe des Entscheidungsbaums begrenzt. Durch den Vergleich der beiden Modelle verstehst du besser, was mit einem „schwachen“ Lerner gemeint ist.

Diese Übung ist Teil des Kurses

<Kurs>Ensemble-Methoden in Python</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Build unrestricted decision tree
clf = ____
clf.fit(X_train, y_train)

# Predict the labels
pred = clf.predict(X_test)

# Print the confusion matrix
cm = confusion_matrix(y_test, pred)
print('Confusion matrix:\n', cm)

# Print the F1 score
score = f1_score(y_test, pred)
print('F1-Score: {:.3f}'.format(score))

Code bearbeiten und ausführen