Instanciar el modelo
En la siguiente serie de ejercicios, diagnosticarás los problemas de sesgo y varianza de un árbol de regresión. El árbol de regresión que definirás en este ejercicio se utilizará para predecir el consumo de mpg de los coches del conjunto de datos de automóviles utilizando todas las características disponibles.
Ya hemos procesado los datos y cargado la matriz de características X
y la matriz y
en tu espacio de trabajo. Además, la clase DecisionTreeRegressor
se importó de sklearn.tree
.
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones del ejercicio
- Importa
train_test_split
desdesklearn.model_selection
. - Divide los datos en un 70 % de entrenamiento y un 30 % de prueba.
- Instancia un
DecisionTreeRegressor
con profundidad máxima 4 ymin_samples_leaf
fijado en 0,26.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)