Specificazione ed estimazione del modello
Hai visto il comando glm() per eseguire una regressione logistica. glm() sta per generalized linear model e offre un’intera famiglia di modelli di regressione.
Usa il dataset dell’esercizio per questo task di coding. I dati defaultData necessari per questo esercizio sono disponibili nel tuo ambiente e pronti per il modeling.
Questo esercizio fa parte del corso
Machine Learning per il Marketing Analytics in R
Istruzioni dell'esercizio
- Usa la funzione
glm()per modellare, con una regressione logistica, la probabilità che un cliente vada in default sul pagamento. Includi tutte le variabili esplicative dell’insieme di dati e specifica i dati da utilizzare. - Non dimenticare di specificare l’argomento
family. - Estrai i coefficienti dal modello, poi trasformali in odds ratio e arrotonda.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = ___, data = ___)
# Take a look at the model
___(logitModelFull)
# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp