Previsão da probabilidade de inadimplência
Todo o processamento de dados está concluído e é hora de começar a criar previsões para a probabilidade de inadimplência. Você deseja treinar um modelo LogisticRegression()
nos dados e examinar como ele prevê a probabilidade de inadimplência.
Para que você possa entender melhor o que o modelo produz com predict_proba
, você deve examinar um registro de exemplo juntamente com a probabilidade prevista de inadimplência. Como você vê as cinco primeiras previsões em relação aos valores reais de loan_status
?
O conjunto de dados cr_loan_prep
juntamente com X_train
, X_test
, y_train
e y_test
já foram carregados no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Treine um modelo de regressão logística nos dados de treinamento e armazene-o como
clf_logistic
. - Use
predict_proba()
nos dados de teste para criar as previsões e armazená-las empreds
. - Crie dois quadros de dados,
preds_df
etrue_df
, para armazenar as cinco primeiras previsões e os valores reais deloan_status
. - Imprima o
true_df
e opreds_df
como um conjunto usando o.concat()
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))