LoslegenKostenlos loslegen

KFold-Cross-Validation

Beim Arbeiten mit ML-Modellen ist es wichtig, ihre Leistung an unbekannten Daten zu bewerten. Eine gängige Technik dafür ist die k-fold Cross-Validation. In dieser Übung schaust du dir an, wie die k-fold Cross-Validation einen Datensatz in Trainings- und Testmengen aufteilt. KFold ist bereits importiert, ebenso die Merkmale des Herzkrankheits-Datensatzes heart_disease_df_X.

Diese Übung ist Teil des Kurses

End-to-End Machine Learning

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein KFold-Objekt mit n_splits=5, shuffle=True und random_state=42
  • Teile die Daten mit kfold.split() auf
  • Gib die Anzahl der Datenpunkte in den Train- und Test-Splits aus

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)
Code bearbeiten und ausführen