Modell instanziieren
In der folgenden Übungsreihe diagnostizierst du Bias- und Varianzprobleme eines Regressionsbaums. Der Regressionsbaum, den du in dieser Aufgabe definierst, soll den Kraftstoffverbrauch (mpg) von Autos aus dem auto-Datensatz anhand aller verfügbaren Features vorhersagen.
Wir haben die Daten bereits aufbereitet und die Feature-Matrix X sowie das Array y in deinen Workspace geladen. Außerdem wurde die Klasse DecisionTreeRegressor aus sklearn.tree importiert.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
- Importiere
train_test_splitaussklearn.model_selection. - Teile die Daten in 70 % Training und 30 % Test.
- Instanziiere einen
DecisionTreeRegressormit einer maximalen Tiefe von 4 undmin_samples_leafauf 0.26 gesetzt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)