Regressione logistica multivariata

In generale, non userai solo loan_int_rate per prevedere la probabilità di default. Vorrai usare tutti i dati a disposizione per fare previsioni.

Con questo in mente, prova ad addestrare un nuovo modello con diverse colonne, chiamate feature, tratte dai dati cr_loan_clean. Questo modello sarà diverso dal primo? Per verificarlo facilmente, puoi controllare l’.intercept_ della regressione logistica. Ricorda che rappresenta l’intercetta sull’asse y della funzione e le log-odds complessive di non-default.

I dati cr_loan_clean sono stati caricati nell’ambiente di lavoro insieme al modello precedente clf_logistic_single.

Questo esercizio fa parte del corso

Credit Risk Modeling in Python

Visualizza corso

Istruzioni dell'esercizio

Crea un nuovo insieme di dati X con loan_int_rate e person_emp_length. Salvalo come X_multi.
Crea un insieme di dati y con solo loan_status.
Crea e .fit() un modello LogisticRegression() sui nuovi dati X. Salvalo come clf_logistic_multi.
Stampa il valore di .intercept_ del modello

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create X data for the model
X_multi = ____[[____,____]]

# Create a set of y data for training
y = ____[[____]]

# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the intercept of the model
print(____.____)

Modifica ed esegui il codice