ComeçarComece gratuitamente

Previsão da probabilidade de inadimplência

Todo o processamento de dados está concluído e é hora de começar a criar previsões para a probabilidade de inadimplência. Você deseja treinar um modelo LogisticRegression() nos dados e examinar como ele prevê a probabilidade de inadimplência.

Para que você possa entender melhor o que o modelo produz com predict_proba, você deve examinar um registro de exemplo juntamente com a probabilidade prevista de inadimplência. Como você vê as cinco primeiras previsões em relação aos valores reais de loan_status?

O conjunto de dados cr_loan_prep juntamente com X_train, X_test, y_train e y_test já foram carregados no espaço de trabalho.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver Curso

Instruções de exercício

  • Treine um modelo de regressão logística nos dados de treinamento e armazene-o como clf_logistic.
  • Use predict_proba() nos dados de teste para criar as previsões e armazená-las em preds.
  • Crie dois quadros de dados, preds_df e true_df, para armazenar as cinco primeiras previsões e os valores reais de loan_status.
  • Imprima o true_df e o preds_df como um conjunto usando o .concat().

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))
Editar e executar código