CommencerCommencer gratuitement

Validation croisée KFold

Avec les modèles de Machine Learning, il est essentiel d’évaluer les performances sur des données jamais vues. Une technique courante pour cela est la validation croisée en k plis (k-fold). Dans cet exercice, vous allez voir comment la validation croisée en k plis découpe un jeu de données en ensembles d’entraînement et de test. KFold est déjà importé, ainsi que les variables de caractéristiques du jeu de données sur les maladies cardiaques heart_disease_df_X.

Cet exercice fait partie du cours

Machine Learning de bout en bout

Afficher le cours

Instructions

  • Créez un objet KFold avec n_splits=5, shuffle=True et random_state=42
  • Séparez les données avec kfold.split()
  • Affichez le nombre de points de données dans les partitions d’entraînement et de test

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)
Modifier et exécuter le code