Crea un único conjunto holdout
Tu jefa te ha pedido que crees un modelo sencillo de random forest sobre el conjunto de datos tic_tac_toe. No quiere que dediques mucho tiempo a seleccionar parámetros; lo que quiere saber es qué tal rendirá el modelo con datos futuros. Para futuras partidas de Tic-Tac-Toe, estaría bien saber si tu modelo puede predecir qué jugador ganará.
El conjunto de datos tic_tac_toe ya está cargado para que lo uses.
Ten en cuenta que en Python, =\ indica que el código era demasiado largo para una sola línea y se ha dividido en dos.
Este ejercicio forma parte del curso
Validación de modelos en Python
Instrucciones del ejercicio
- Crea el conjunto
Xgenerando variables ficticias (dummies) para todas las columnas categóricas. - Divide
Xeyen los conjuntos de train (X_train,y_train) y test (X_test,y_test). - Realiza la división usando un 10% para test
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]
# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____ = ____(X, y, ____=____, random_state=1111)