Validación cruzada con KFold

Al trabajar con modelos de Machine Learning, es fundamental evaluar su rendimiento en datos no vistos. Una técnica común para ello es la validación cruzada k-fold. En este ejercicio, verás cómo esta técnica divide un conjunto de datos en conjuntos de entrenamiento y prueba. KFold ya está importado, así como las características del conjunto de datos de enfermedades cardíacas heart_disease_df_X.

Este ejercicio forma parte del curso

Machine Learning de extremo a extremo

Ver curso

Instrucciones del ejercicio

Crea un objeto KFold con n_splits=5, shuffle=True y random_state=42
Divide los datos usando kfold.split()
Imprime el número de puntos de datos en las particiones de entrenamiento y prueba

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)

Editar y ejecutar código