ComenzarEmpieza gratis

Crea dos conjuntos de validación (holdout)

Hace poco creaste un modelo sencillo de random forest para predecir victorias en partidas de Tic-Tac-Toe para tu jefa y, a petición suya, no hiciste ajuste de parámetros. Por desgracia, la exactitud general del modelo fue demasiado baja para sus estándares. Esta vez te ha pedido que te centres en el rendimiento del modelo.

Antes de empezar a probar distintos modelos y conjuntos de parámetros, tendrás que dividir los datos en conjuntos de entrenamiento, validación y prueba. Recuerda que, después de separar los datos en entrenamiento y prueba, el conjunto de validación se crea dividiendo el conjunto de entrenamiento.

Los conjuntos de datos X e y ya están cargados para que los uses.

Este ejercicio forma parte del curso

Validación de modelos en Python

Ver curso

Instrucciones del ejercicio

  • Crea conjuntos temporales y conjuntos de prueba (X_test, y_test). Usa el 20% del total de datos para los conjuntos de prueba.
  • Con los conjuntos temporales (X_temp, y_temp), crea los conjuntos de entrenamiento (X_train, y_train) y validación (X_val, y_val).
  • Usa el 25% de los datos temporales para los conjuntos de validación.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create temporary training and final testing datasets
X_temp, ____, y_temp, ____  =\
    train_test_split(X, y, ____=____, random_state=1111)

# Create the final training and validation datasets
____, ____, ____, ____ =\
    train_test_split(X_temp, y_temp, ____=____, random_state=1111)
Editar y ejecutar código