ComeçarComece de graça

Crie um conjunto de validação (holdout)

Sua chefe pediu que você criasse um modelo simples de random forest no conjunto de dados tic_tac_toe. Ela não quer que você gaste muito tempo escolhendo parâmetros; em vez disso, quer saber quão bem o modelo vai funcionar em dados futuros. Para futuras partidas de Tic-Tac-Toe, seria bom saber se seu modelo consegue prever qual jogador vai vencer.

O conjunto de dados tic_tac_toe já foi carregado para você usar.

Observe que, em Python, =\ indica que o código era longo demais para uma linha e foi dividido em duas linhas.

Este exercício faz parte do curso

Validação de Modelos em Python

Ver curso

Instruções do exercício

  • Crie o conjunto X gerando variáveis dummies para todas as colunas categóricas.
  • Divida X e y em conjuntos de treino (X_train, y_train) e teste (X_test, y_test).
  • Faça a divisão usando 10% para teste

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]

# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____  = ____(X, y, ____=____, random_state=1111)
Editar e executar o código