Het model instantiëren
In de volgende reeks oefeningen ga je de bias- en variance-problemen van een regressieboom diagnosticeren. De regressieboom die je in deze oefening opstelt, wordt gebruikt om het mpg-verbruik van auto's uit de auto-gegevensset te voorspellen met alle beschikbare features.
We hebben de data al verwerkt en de featurematrix X en de array y in je werkruimte geladen. Daarnaast is de klasse DecisionTreeRegressor geïmporteerd uit sklearn.tree.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
- Importeer
train_test_splituitsklearn.model_selection. - Splits de data in 70% train en 30% test.
- Instantieer een
DecisionTreeRegressormet een maximale diepte van 4 enmin_samples_leafingesteld op 0.26.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)