CommencerCommencer gratuitement

Créer deux ensembles de contrôle

Vous avez récemment créé un modèle Random Forest simple pour prédire les victoires au Tic-Tac-Toe pour votre supérieure, et, à sa demande, vous n’avez procédé à aucun réglage d’hyperparamètres. Malheureusement, la précision globale du modèle s’est révélée trop faible pour ses attentes. Cette fois, elle vous demande de vous concentrer sur la performance du modèle.

Avant d’évaluer différents modèles et jeux de paramètres, vous devez diviser les données en ensembles d’entraînement, de validation et de test. Rappelez-vous qu’après avoir séparé les données en ensembles d’entraînement et de test, l’ensemble de validation est créé en scindant l’ensemble d’entraînement.

Les jeux de données X et y ont été chargés pour vous.

Cet exercice fait partie du cours

Validation des modèles en Python

Afficher le cours

Instructions

  • Créez des jeux de données temporaires et de test (X_test, y_test). Utilisez 20 % de l’ensemble des données pour les jeux de test.
  • À partir des jeux de données temporaires (X_temp, y_temp), créez les jeux d’entraînement (X_train, y_train) et de validation (X_val, y_val).
  • Utilisez 25 % des données temporaires pour les jeux de validation.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create temporary training and final testing datasets
X_temp, ____, y_temp, ____  =\
    train_test_split(X, y, ____=____, random_state=1111)

# Create the final training and validation datasets
____, ____, ____, ____ =\
    train_test_split(X_temp, y_temp, ____=____, random_state=1111)
Modifier et exécuter le code