Previsão da probabilidade de inadimplência
Todo o processamento de dados está concluído e é hora de começar a criar previsões para a probabilidade de inadimplência. Você deseja treinar um modelo LogisticRegression() nos dados e examinar como ele prevê a probabilidade de inadimplência.
Para que você possa entender melhor o que o modelo produz com predict_proba, você deve examinar um registro de exemplo juntamente com a probabilidade prevista de inadimplência. Como você vê as cinco primeiras previsões em relação aos valores reais de loan_status?
O conjunto de dados cr_loan_prep juntamente com X_train, X_test, y_train e y_test já foram carregados no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções do exercício
- Treine um modelo de regressão logística nos dados de treinamento e armazene-o como
clf_logistic. - Use
predict_proba()nos dados de teste para criar as previsões e armazená-las empreds. - Crie dois quadros de dados,
preds_dfetrue_df, para armazenar as cinco primeiras previsões e os valores reais deloan_status. - Imprima o
true_dfe opreds_dfcomo um conjunto usando o.concat().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))