Das Modell instanziieren
In den folgenden Übungen wirst du die Verzerrungs- und Varianzprobleme eines Regressionsbaums diagnostizieren. Der Regressionsbaum, den du in dieser Übung definierst, wird verwendet, um den Benzinverbrauch von Autos aus dem Auto-Datensatz mit allen verfügbaren Merkmalen vorherzusagen.
Wir haben die Daten bereits verarbeitet und die Merkmalsmatrix X
und das Array y
in deinen Arbeitsbereich geladen. Außerdem wurde die Klasse DecisionTreeRegressor
von sklearn.tree
importiert.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
- Importiere
train_test_split
vonsklearn.model_selection
. - Teile die Daten in 70% Training und 30% Test auf.
- Erstelle eine
DecisionTreeRegressor
mit einer maximalen Tiefe von 4 undmin_samples_leaf
auf 0,26.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)