ComeçarComece gratuitamente

Árvores para padrões

Agora você treinará um modelo de árvore com gradiente aumentado nos dados de crédito e verá uma amostra de algumas das previsões. Você se lembra de quando analisou pela primeira vez as previsões do modelo de regressão logística? Eles não pareciam bons. Você acha que esse modelo será diferente?

Os dados de crédito cr_loan_prep, os conjuntos de treinamento X_train e y_train e os dados de teste X_test estão disponíveis no espaço de trabalho. O pacote XGBoost é carregado como xgb.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver Curso

Instruções de exercício

  • Crie e treine uma árvore com aumento de gradiente usando XGBClassifier() e nomeie-a como clf_gbt.
  • Preveja as probabilidades de inadimplência nos dados de teste e armazene os resultados em gbt_preds.
  • Crie dois quadros de dados, preds_df e true_df, para armazenar as cinco primeiras previsões e os valores reais de loan_status.
  • Concatene e imprima os quadros de dados true_df e preds_df em ordem e verifique os resultados do modelo.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))

# Predict with a model
____ = clf_gbt.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))
Editar e executar código