ComeçarComece de graça

Validação cruzada KFold

Ao trabalhar com modelos de Machine Learning, é essencial avaliar o desempenho em dados não vistos. Uma técnica comum para isso é a validação cruzada k-fold. Neste exercício, você vai explorar como a técnica de validação cruzada k-fold divide um conjunto de dados em conjuntos de treino e teste. KFold já foi importado para você, assim como as variáveis de atributos do conjunto de dados de doença cardíaca, heart_disease_df_X.

Este exercício faz parte do curso

Machine Learning de ponta a ponta

Ver curso

Instruções do exercício

  • Crie um objeto KFold com n_splits=5, shuffle=True e random_state=42
  • Divida os dados usando kfold.split()
  • Imprima o número de pontos de dados nas divisões de treino e teste

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a KFold object
kfold = ____(____, ____, ____)

# Get the train and test data from the first split from the shuffled KFold
train_data_split, test_data_split = next(____.____(____))

# Print out the number of datapoints in the train and test splits
print("Number of training datapoints in heart_disease_df_X:", ____)
print("Number of training datapoints in split:", ____)
print("Number of testing datapoints in split:", ____)
Editar e executar o código