Validación cruzada con KFold
Al trabajar con modelos de Machine Learning, es fundamental evaluar su rendimiento en datos no vistos. Una técnica común para ello es la validación cruzada k-fold. En este ejercicio, verás cómo esta técnica divide un conjunto de datos en conjuntos de entrenamiento y prueba. KFold ya está importado, así como las características del conjunto de datos de enfermedades cardíacas heart_disease_df_X.
Este ejercicio forma parte del curso
Machine Learning de extremo a extremo
Instrucciones del ejercicio
- Crea un objeto KFold con
n_splits=5,shuffle=Trueyrandom_state=42 - Divide los datos usando
kfold.split() - Imprime el número de puntos de datos en las particiones de entrenamiento y prueba
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a KFold object
kfold = ____(____, ____, ____)
# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))
# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)