Deux échantillons
Après avoir construit plusieurs modèles de classification à partir du jeu de données tic_tac_toe, vous constatez que certains modèles généralisent moins bien que d’autres. Vous avez bien créé des partitions d’entraînement et de test comme on vous l’a appris, et vous vous demandez pourquoi votre processus de validation ne fonctionne pas comme prévu.
Après avoir essayé une autre partition entraînement/test, vous avez observé des précisions différentes pour votre modèle de Machine Learning. Avant de vous laisser frustrer par ces résultats variables, vous décidez d’examiner ce qui pourrait se passer.
Cet exercice fait partie du cours
Validation des modèles en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create two different samples of 200 observations
sample1 = tic_tac_toe.____(____, random_state=1111)
sample2 = tic_tac_toe.____(____, random_state=1171)