ComeçarComece gratuitamente

Validação cruzada de modelos de crédito

Os empréstimos de crédito e seus dados mudam com o tempo, e nem sempre se parecerão com o que foi carregado nos conjuntos de teste atuais. Portanto, você pode usar a validação cruzada para experimentar vários conjuntos de treinamento e teste menores, derivados dos originais X_train e y_train.

Use a função XGBoost cv() para realizar a validação cruzada. Você precisará configurar todos os parâmetros para que o cv() use nos dados de teste.

Os conjuntos de dados X_train, y_train são carregados no espaço de trabalho junto com o modelo treinado gbt e o dicionário de parâmetros params que será impresso assim que o exercício for carregado.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver Curso

Instruções de exercício

  • Defina o número de dobras como 5 e a parada como 10. Armazene-os como n_folds e early_stopping.
  • Crie o objeto de matriz DTrain usando os dados de treinamento.
  • Use cv() nos parâmetros, dobras e objetos de parada antecipada. Armazene os resultados como cv_df.
  • Imprimir o conteúdo de cv_df.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Set the values for number of folds and stopping iterations
____ = ____
____ = ____

# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)

# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
            early_stopping_rounds=____)

# Print the cross validations data frame
____(____)
Editar e executar código