Eingeschränkte und uneingeschränkte Entscheidungsbäume
In dieser Übung greifen wir das Pokémon-Datenset aus dem letzten Kapitel wieder auf. Ziel ist es, vorherzusagen, ob ein gegebenes Pokémon legendär ist oder nicht.
Du wirst zwei separate Decision-Tree-Klassifikatoren bauen. Im ersten gibst du die Parameter min_samples_leaf und min_samples_split an, aber keine maximale Tiefe, sodass sich der Baum ohne Einschränkungen vollständig entwickeln kann.
Im zweiten legst du Einschränkungen fest, indem du die Tiefe des Entscheidungsbaums begrenzt. Durch den Vergleich der beiden Modelle verstehst du besser, was mit einem „schwachen“ Lerner gemeint ist.
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build unrestricted decision tree
clf = ____
clf.fit(X_train, y_train)
# Predict the labels
pred = clf.predict(X_test)
# Print the confusion matrix
cm = confusion_matrix(y_test, pred)
print('Confusion matrix:\n', cm)
# Print the F1 score
score = f1_score(y_test, pred)
print('F1-Score: {:.3f}'.format(score))