IniziaInizia gratis

Convalida incrociata KFold

Quando lavori con modelli di Machine Learning, è fondamentale valutarne le prestazioni su dati mai visti prima, garantendo al contempo una valutazione corretta. Una tecnica comune a questo scopo è la convalida incrociata k-fold. In questo esercizio esplorerai come la tecnica k-fold suddivide un insieme di dati in train e test. KFold è già importato per te, così come le feature del dataset sulle malattie cardiache heart_disease_df_X.

Questo esercizio fa parte del corso

Machine Learning end-to-end

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un oggetto KFold con n_splits=5, shuffle=True e random_state=42
  • Suddividi i dati usando kfold.split()
  • Stampa il numero di punti dati nelle suddivisioni di train e test

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)
Modifica ed esegui il codice