Regressione logistica di base
Nel video hai visto un modello di regressione logistica che includeva la variabile age come predittore. Ora includerai una variabile categorica e imparerai a interpretare le sue stime dei parametri.
Quando includi una variabile categorica in un modello di regressione logistica in R, otterrai una stima del parametro per tutte le sue categorie tranne una. Questa categoria per cui non viene fornita alcuna stima si chiama categoria di riferimento. Il parametro per ciascuna delle altre categorie rappresenta l’odds ratio a favore dell’insolvenza del prestito tra la categoria di interesse e la categoria di riferimento. Non preoccuparti se non è ancora tutto chiarissimo: farai altri esercizi su questo più avanti!
Questo esercizio fa parte del corso
Credit Risk Modeling in R
Istruzioni dell'esercizio
- Costruisci un modello di regressione logistica chiamato
log_model_catcon la variabile categoricair_catcome unico predittore. La tua chiamata a glm() deve contenere tre argomenti: loan_status ~ ir_catfamily = "binomial"data = training_set- Visualizza il risultato nella console per vedere le stime dei parametri.
- Scopri qual è la categoria di riferimento guardando di nuovo la struttura di
ir_cat(nell’insieme di dati completoloan_data). Usa la funzionetable()per farlo.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build a glm model with variable ir_cat as a predictor
# Print the parameter estimates
# Look at the different categories in ir_cat using table()