Convalida incrociata KFold
Quando lavori con modelli di Machine Learning, è fondamentale valutarne le prestazioni su dati mai visti prima, garantendo al contempo una valutazione corretta. Una tecnica comune a questo scopo è la convalida incrociata k-fold. In questo esercizio esplorerai come la tecnica k-fold suddivide un insieme di dati in train e test. KFold è già importato per te, così come le feature del dataset sulle malattie cardiache heart_disease_df_X.
Questo esercizio fa parte del corso
Machine Learning end-to-end
Istruzioni dell'esercizio
- Crea un oggetto KFold con
n_splits=5,shuffle=Trueerandom_state=42 - Suddividi i dati usando
kfold.split() - Stampa il numero di punti dati nelle suddivisioni di train e test
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a KFold object
kfold = ____(____, ____, ____)
# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))
# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)