LoslegenKostenlos loslegen

Modell instanziieren

In den nächsten Übungen diagnostizierst du Bias- und Varianzprobleme eines Regressionsbaums. Der Regressionsbaum, den du in dieser Aufgabe definierst, wird verwendet, um den mpg-Verbrauch von Autos aus dem Auto-Datensatz anhand aller verfügbaren Features vorherzusagen.

Wir haben die Daten bereits verarbeitet und die Feature-Matrix X sowie das Array y in deinem Workspace geladen. Außerdem wurde die Klasse DecisionTreeRegressor aus sklearn.tree importiert.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere train_test_split aus sklearn.model_selection.
  • Teile die Daten in 70 % Training und 30 % Test auf.
  • Instanziiere einen DecisionTreeRegressor mit einer maximalen Tiefe von 4 und min_samples_leaf auf 0.26 gesetzt.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import train_test_split from sklearn.model_selection
____

# Set SEED for reproducibility
SEED = 1

# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)

# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)
Code bearbeiten und ausführen