KFold-Cross-Validation

Beim Arbeiten mit ML-Modellen ist es wichtig, ihre Leistung an unbekannten Daten zu bewerten. Eine gängige Technik dafür ist die k-fold Cross-Validation. In dieser Übung schaust du dir an, wie die k-fold Cross-Validation einen Datensatz in Trainings- und Testmengen aufteilt. KFold ist bereits importiert, ebenso die Merkmale des Herzkrankheits-Datensatzes heart_disease_df_X.

Diese Übung ist Teil des Kurses

<Kurs>End-to-End Machine Learning</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle ein KFold-Objekt mit n_splits=5, shuffle=True und random_state=42
Teile die Daten mit kfold.split() auf
Gib die Anzahl der Datenpunkte in den Train- und Test-Splits aus

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)

Code bearbeiten und ausführen