Modell instanziieren
In den nächsten Übungen diagnostizierst du Bias- und Varianzprobleme eines Regressionsbaums. Der Regressionsbaum, den du in dieser Aufgabe definierst, wird verwendet, um den mpg-Verbrauch von Autos aus dem Auto-Datensatz anhand aller verfügbaren Features vorherzusagen.
Wir haben die Daten bereits verarbeitet und die Feature-Matrix X sowie das Array y in deinem Workspace geladen. Außerdem wurde die Klasse DecisionTreeRegressor aus sklearn.tree importiert.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
- Importiere
train_test_splitaussklearn.model_selection. - Teile die Daten in 70 % Training und 30 % Test auf.
- Instanziiere einen
DecisionTreeRegressormit einer maximalen Tiefe von 4 undmin_samples_leafauf 0.26 gesetzt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)