Crie um conjunto de validação (holdout)
Sua chefe pediu que você criasse um modelo simples de random forest no conjunto de dados tic_tac_toe. Ela não quer que você gaste muito tempo escolhendo parâmetros; em vez disso, quer saber quão bem o modelo vai funcionar em dados futuros. Para futuras partidas de Tic-Tac-Toe, seria bom saber se seu modelo consegue prever qual jogador vai vencer.
O conjunto de dados tic_tac_toe já foi carregado para você usar.
Observe que, em Python, =\ indica que o código era longo demais para uma linha e foi dividido em duas linhas.
Este exercício faz parte do curso
Validação de Modelos em Python
Instruções do exercício
- Crie o conjunto
Xgerando variáveis dummies para todas as colunas categóricas. - Divida
Xeyem conjuntos de treino (X_train,y_train) e teste (X_test,y_test). - Faça a divisão usando 10% para teste
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]
# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____ = ____(X, y, ____=____, random_state=1111)