Instanciar el modelo
En la siguiente serie de ejercicios, diagnosticarás los problemas de sesgo y varianza de un árbol de regresión. El árbol de regresión que definirás en este ejercicio se utilizará para predecir el consumo de mpg de los coches del conjunto de datos de automóviles utilizando todas las características disponibles.
Ya hemos procesado los datos y cargado la matriz de características X y la matriz y en tu espacio de trabajo. Además, la clase DecisionTreeRegressor se importó de sklearn.tree.
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones del ejercicio
- Importa
train_test_splitdesdesklearn.model_selection. - Divide los datos en un 70 % de entrenamiento y un 30 % de prueba.
- Instancia un
DecisionTreeRegressorcon profundidad máxima 4 ymin_samples_leaffijado en 0,26.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)