Validação cruzada KFold
Ao trabalhar com modelos de Machine Learning, é essencial avaliar o desempenho em dados não vistos. Uma técnica comum para isso é a validação cruzada k-fold. Neste exercício, você vai explorar como a técnica de validação cruzada k-fold divide um conjunto de dados em conjuntos de treino e teste. KFold já foi importado para você, assim como as variáveis de atributos do conjunto de dados de doença cardíaca, heart_disease_df_X.
Este exercício faz parte do curso
Machine Learning de ponta a ponta
Instruções do exercício
- Crie um objeto KFold com
n_splits=5,shuffle=Trueerandom_state=42 - Divida os dados usando
kfold.split() - Imprima o número de pontos de dados nas divisões de treino e teste
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a KFold object
kfold = ____(____, ____, ____)
# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))
# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)