ComenzarEmpieza gratis

Validación cruzada con KFold

Al trabajar con modelos de Machine Learning, es fundamental evaluar su rendimiento en datos no vistos. Una técnica común para ello es la validación cruzada k-fold. En este ejercicio, verás cómo esta técnica divide un conjunto de datos en conjuntos de entrenamiento y prueba. KFold ya está importado, así como las características del conjunto de datos de enfermedades cardíacas heart_disease_df_X.

Este ejercicio forma parte del curso

Machine Learning de extremo a extremo

Ver curso

Instrucciones del ejercicio

  • Crea un objeto KFold con n_splits=5, shuffle=True y random_state=42
  • Divide los datos usando kfold.split()
  • Imprime el número de puntos de datos en las particiones de entrenamiento y prueba

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)
Editar y ejecutar código