Validation croisée KFold
Avec les modèles de Machine Learning, il est essentiel d’évaluer les performances sur des données jamais vues. Une technique courante pour cela est la validation croisée en k plis (k-fold). Dans cet exercice, vous allez voir comment la validation croisée en k plis découpe un jeu de données en ensembles d’entraînement et de test. KFold est déjà importé, ainsi que les variables de caractéristiques du jeu de données sur les maladies cardiaques heart_disease_df_X.
Cet exercice fait partie du cours
Machine Learning de bout en bout
Instructions
- Créez un objet KFold avec
n_splits=5,shuffle=Trueetrandom_state=42 - Séparez les données avec
kfold.split() - Affichez le nombre de points de données dans les partitions d’entraînement et de test
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a KFold object
kfold = ____(____, ____, ____)
# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))
# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)