Créer un jeu de validation simple (holdout)
Votre responsable vous demande de créer un modèle Random Forest simple sur le jeu de données tic_tac_toe. Elle ne souhaite pas que vous passiez beaucoup de temps sur le choix des hyperparamètres ; elle veut plutôt savoir comment le modèle se comportera sur de nouvelles données. Pour de futures parties de Tic-Tac-Toe, il serait utile de savoir si votre modèle peut prédire quel joueur va gagner.
Le jeu de données tic_tac_toe a été chargé pour vous.
Notez qu’en Python, =\ indique que le code était trop long pour tenir sur une seule ligne et a été scindé sur deux lignes.
Cet exercice fait partie du cours
Validation des modèles en Python
Instructions
- Créez le jeu de données
Xen générant des variables indicatrices pour toutes les colonnes catégorielles. - Séparez
Xetyen jeux d’entraînement (X_train,y_train) et de test (X_test,y_test). - Effectuez la séparation en utilisant 10 % des données pour le test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]
# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____ = ____(X, y, ____=____, random_state=1111)