ComenzarEmpieza gratis

Crea un único conjunto holdout

Tu jefa te ha pedido que crees un modelo sencillo de random forest sobre el conjunto de datos tic_tac_toe. No quiere que dediques mucho tiempo a seleccionar parámetros; lo que quiere saber es qué tal rendirá el modelo con datos futuros. Para futuras partidas de Tic-Tac-Toe, estaría bien saber si tu modelo puede predecir qué jugador ganará.

El conjunto de datos tic_tac_toe ya está cargado para que lo uses.

Ten en cuenta que en Python, =\ indica que el código era demasiado largo para una sola línea y se ha dividido en dos.

Este ejercicio forma parte del curso

Validación de modelos en Python

Ver curso

Instrucciones del ejercicio

  • Crea el conjunto X generando variables ficticias (dummies) para todas las columnas categóricas.
  • Divide X e y en los conjuntos de train (X_train, y_train) y test (X_test, y_test).
  • Realiza la división usando un 10% para test

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]

# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____  = ____(X, y, ____=____, random_state=1111)
Editar y ejecutar código