ComeçarComece gratuitamente

Criação de conjuntos de treinamento e teste

Você acabou de treinar modelos LogisticRegression() em colunas diferentes.

Você sabe que os dados devem ser separados em conjuntos de treinamento e de teste. O site test_train_split() é usado para criar ambos ao mesmo tempo. O conjunto de treinamento é usado para fazer previsões, enquanto o conjunto de teste é usado para avaliação. Sem avaliar o modelo, você não tem como saber qual será o desempenho dele com novos dados de empréstimo.

Além do intercept_, que é um atributo do modelo, os modelos LogisticRegression() também têm o atributo .coef_. Isso mostra a importância de cada coluna de treinamento para prever a probabilidade de inadimplência.

O conjunto de dados cr_loan_clean já está carregado no espaço de trabalho.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver Curso

Instruções de exercício

  • Crie o conjunto de dados X usando taxa de juros, duração do emprego e renda. Crie o conjunto y usando o status do empréstimo.
  • Use train_test_split() para criar os conjuntos de treinamento e teste a partir de X e y.
  • Crie e treine um modelo LogisticRegression() e armazene-o como clf_logistic.
  • Imprima os coeficientes do modelo usando .coef_.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Create the X and y data sets
X = ____[[____,____,____]]
y = ____[[____]]

# Use test_train_split to create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=.4, random_state=123)

# Create and fit the logistic regression model
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the models coefficients
print(____.coef_)
Editar e executar código