Adatta un modello per la probabilità di sopravvivenza dei passeri
In questo esercizio stimerai la probabilità che un passero sopravviva a una forte tempesta invernale, in base alle sue caratteristiche fisiche. L'insieme di dati sparrow è già caricato. L'esito da prevedere è status ("Survived", "Perished"). Le variabili che considereremo sono:
total_length: lunghezza dell'uccello dalla punta del becco alla punta della coda (mm)weight: in grammihumerus: lunghezza dell'omero ("osso del braccio" che collega l'ala al corpo) (pollici)
Ricorda che quando usi glm() (docs) per creare un modello di regressione logistica, devi specificare esplicitamente family = binomial:
glm(formula, data = data, family = binomial)
Userai summary() e broom::glance() per vedere funzioni diverse
per esaminare un modello di regressione logistica. Una delle diagnostiche che osserverai è l'analogo dell'R-quadrato, chiamato pseudo-\(R^2\).
$$ pseudoR^2 = 1 - \frac{deviance}{null.deviance} $$
Puoi considerare la devianza come analoga alla varianza: è una misura della variazione nei dati categorici. Il pseudo-\(R^2\) è analogo all'\(R^2\) per la regressione standard: l'\(R^2\) misura la "varianza spiegata" di un modello di regressione. Il pseudo-\(R^2\) misura la "devianza spiegata".
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Come suggerito nel video, effettuerai la previsione sugli esiti
TRUEeFALSE. Crea una nuova colonnasurvivednel data framesparrowche sia TRUE quandostatus == "Survived". - Crea la formula
fmlache esprimesurvivedcome funzione delle variabili di interesse. Stampala. - Adatta un modello di regressione logistica per prevedere la probabilità di sopravvivenza dei passeri. Assegna il modello alla variabile
sparrow_model. - Chiama
summary()per vedere i coefficienti del modello, la devianza e la devianza nulla. - Chiama
glance()sul modello per vedere le devianze e altre diagnostiche in un data frame. Assegna l'output diglance()alla variabileperf. - Calcola il pseudo-\(R^2\).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# sparrow is available
summary(sparrow)
# Create the survived column
sparrow$survived <- ___
# Create the formula
(fmla <- _____)
# Fit the logistic regression model
sparrow_model <- ___
# Call summary
___
# Call glance
(perf <- ___)
# Calculate pseudo-R-squared
(pseudoR2 <- ___)