Regressione logistica multivariata
In generale, non userai solo loan_int_rate per prevedere la probabilità di default. Vorrai usare tutti i dati a disposizione per fare previsioni.
Con questo in mente, prova ad addestrare un nuovo modello con diverse colonne, chiamate feature, tratte dai dati cr_loan_clean. Questo modello sarà diverso dal primo? Per verificarlo facilmente, puoi controllare l’.intercept_ della regressione logistica. Ricorda che rappresenta l’intercetta sull’asse y della funzione e le log-odds complessive di non-default.
I dati cr_loan_clean sono stati caricati nell’ambiente di lavoro insieme al modello precedente clf_logistic_single.
Questo esercizio fa parte del corso
Credit Risk Modeling in Python
Istruzioni dell'esercizio
- Crea un nuovo insieme di dati
Xconloan_int_rateeperson_emp_length. Salvalo comeX_multi. - Crea un insieme di dati
ycon sololoan_status. - Crea e
.fit()un modelloLogisticRegression()sui nuovi datiX. Salvalo comeclf_logistic_multi. - Stampa il valore di
.intercept_del modello
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create X data for the model
X_multi = ____[[____,____]]
# Create a set of y data for training
y = ____[[____]]
# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the intercept of the model
print(____.____)