ComeçarComece de graça

Validação cruzada de modelos de crédito

Empréstimos e seus dados mudam ao longo do tempo, e nem sempre vão se parecer com o que foi carregado nos conjuntos de teste atuais. Por isso, você pode usar validação cruzada para tentar vários conjuntos menores de treino e teste derivados de X_train e y_train originais.

Use a função cv() do XGBoost para executar a validação cruzada. Você precisará configurar todos os parâmetros para a cv() usar nos dados de teste.

Os conjuntos X_train, y_train estão carregados no workspace, junto com o modelo treinado gbt e o dicionário de parâmetros params, que será impresso quando o exercício carregar.

Este exercício faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

Instruções do exercício

  • Defina o número de folds como 5 e o critério de parada como 10. Armazene-os em n_folds e early_stopping.
  • Crie o objeto de matriz DTrain usando os dados de treino.
  • Use cv() com os parâmetros, folds e objetos de early stopping. Armazene o resultado em cv_df.
  • Imprima o conteúdo de cv_df.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Set the values for number of folds and stopping iterations
____ = ____
____ = ____

# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)

# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
            early_stopping_rounds=____)

# Print the cross validations data frame
____(____)
Editar e executar o código