Aan de slagGa gratis aan de slag

Het model instantiëren

In de volgende reeks oefeningen ga je de bias- en variance-problemen van een regressieboom diagnosticeren. De regressieboom die je in deze oefening opstelt, wordt gebruikt om het mpg-verbruik van auto's uit de auto-gegevensset te voorspellen met alle beschikbare features.

We hebben de data al verwerkt en de featurematrix X en de array y in je werkruimte geladen. Daarnaast is de klasse DecisionTreeRegressor geïmporteerd uit sklearn.tree.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in Python

Cursus bekijken

Oefeninstructies

  • Importeer train_test_split uit sklearn.model_selection.
  • Splits de data in 70% train en 30% test.
  • Instantieer een DecisionTreeRegressor met een maximale diepte van 4 en min_samples_leaf ingesteld op 0.26.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import train_test_split from sklearn.model_selection
____

# Set SEED for reproducibility
SEED = 1

# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)

# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)
Code bewerken en uitvoeren