Árvores para padrões
Agora você treinará um modelo de árvore com gradiente aumentado nos dados de crédito e verá uma amostra de algumas das previsões. Você se lembra de quando analisou pela primeira vez as previsões do modelo de regressão logística? Eles não pareciam bons. Você acha que esse modelo será diferente?
Os dados de crédito cr_loan_prep
, os conjuntos de treinamento X_train
e y_train
e os dados de teste X_test
estão disponíveis no espaço de trabalho. O pacote XGBoost é carregado como xgb
.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Crie e treine uma árvore com aumento de gradiente usando
XGBClassifier()
e nomeie-a comoclf_gbt
. - Preveja as probabilidades de inadimplência nos dados de teste e armazene os resultados em
gbt_preds
. - Crie dois quadros de dados,
preds_df
etrue_df
, para armazenar as cinco primeiras previsões e os valores reais deloan_status
. - Concatene e imprima os quadros de dados
true_df
epreds_df
em ordem e verifique os resultados do modelo.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))
# Predict with a model
____ = clf_gbt.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))