Aan de slagGa gratis aan de slag

KFold-crossvalidatie

Wanneer je met ML-modellen werkt, is het essentieel om hun prestaties op ongeziene data te evalueren. Een veelgebruikte techniek hiervoor is k-fold-crossvalidatie. In deze oefening ontdek je hoe k-fold-crossvalidatie een gegevensset opsplitst in trainings- en testsets. KFold is al voor je geïmporteerd, net als de features van de hartziektedataset heart_disease_df_X.

Deze oefening maakt deel uit van de cursus

End-to-End Machine Learning

Cursus bekijken

Oefeninstructies

  • Maak een KFold-object met n_splits=5, shuffle=True en random_state=42
  • Splits de data met kfold.split()
  • Print het aantal datapunten in de train- en test-splits

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)
Code bewerken en uitvoeren