KFold-Cross-Validation
Beim Arbeiten mit ML-Modellen ist es wichtig, ihre Leistung an unbekannten Daten zu bewerten. Eine gängige Technik dafür ist die k-fold Cross-Validation. In dieser Übung schaust du dir an, wie die k-fold Cross-Validation einen Datensatz in Trainings- und Testmengen aufteilt. KFold ist bereits importiert, ebenso die Merkmale des Herzkrankheits-Datensatzes heart_disease_df_X.
Diese Übung ist Teil des Kurses
End-to-End Machine Learning
Anleitung zur Übung
- Erstelle ein KFold-Objekt mit
n_splits=5,shuffle=Trueundrandom_state=42 - Teile die Daten mit
kfold.split()auf - Gib die Anzahl der Datenpunkte in den Train- und Test-Splits aus
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a KFold object
kfold = ____(____, ____, ____)
# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))
# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)