ComenzarEmpieza gratis

Instanciar el modelo

En la siguiente serie de ejercicios, diagnosticarás los problemas de sesgo y varianza de un árbol de regresión. El árbol de regresión que definirás en este ejercicio se utilizará para predecir el consumo de mpg de los coches del conjunto de datos de automóviles utilizando todas las características disponibles.

Ya hemos procesado los datos y cargado la matriz de características X y la matriz y en tu espacio de trabajo. Además, la clase DecisionTreeRegressor se importó de sklearn.tree.

Este ejercicio forma parte del curso

Machine learning con modelos basados en árboles en Python

Ver curso

Instrucciones del ejercicio

  • Importa train_test_split desde sklearn.model_selection.
  • Divide los datos en un 70 % de entrenamiento y un 30 % de prueba.
  • Instancia un DecisionTreeRegressor con profundidad máxima 4 y min_samples_leaf fijado en 0,26.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import train_test_split from sklearn.model_selection
____

# Set SEED for reproducibility
SEED = 1

# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)

# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)
Editar y ejecutar código