CommencerCommencer gratuitement

Créer un jeu de validation simple (holdout)

Votre responsable vous demande de créer un modèle Random Forest simple sur le jeu de données tic_tac_toe. Elle ne souhaite pas que vous passiez beaucoup de temps sur le choix des hyperparamètres ; elle veut plutôt savoir comment le modèle se comportera sur de nouvelles données. Pour de futures parties de Tic-Tac-Toe, il serait utile de savoir si votre modèle peut prédire quel joueur va gagner.

Le jeu de données tic_tac_toe a été chargé pour vous.

Notez qu’en Python, =\ indique que le code était trop long pour tenir sur une seule ligne et a été scindé sur deux lignes.

Cet exercice fait partie du cours

Validation des modèles en Python

Afficher le cours

Instructions

  • Créez le jeu de données X en générant des variables indicatrices pour toutes les colonnes catégorielles.
  • Séparez X et y en jeux d’entraînement (X_train, y_train) et de test (X_test, y_test).
  • Effectuez la séparation en utilisant 10 % des données pour le test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]

# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____  = ____(X, y, ____=____, random_state=1111)
Modifier et exécuter le code