LoslegenKostenlos loslegen

Modell instanziieren

In der folgenden Übungsreihe diagnostizierst du Bias- und Varianzprobleme eines Regressionsbaums. Der Regressionsbaum, den du in dieser Aufgabe definierst, soll den Kraftstoffverbrauch (mpg) von Autos aus dem auto-Datensatz anhand aller verfügbaren Features vorhersagen.

Wir haben die Daten bereits aufbereitet und die Feature-Matrix X sowie das Array y in deinen Workspace geladen. Außerdem wurde die Klasse DecisionTreeRegressor aus sklearn.tree importiert.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere train_test_split aus sklearn.model_selection.
  • Teile die Daten in 70 % Training und 30 % Test.
  • Instanziiere einen DecisionTreeRegressor mit einer maximalen Tiefe von 4 und min_samples_leaf auf 0.26 gesetzt.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import train_test_split from sklearn.model_selection
____

# Set SEED for reproducibility
SEED = 1

# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)

# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)
Code bearbeiten und ausführen