IniziaInizia gratis

Adatta un modello per la probabilità di sopravvivenza dei passeri

In questo esercizio stimerai la probabilità che un passero sopravviva a una forte tempesta invernale, in base alle sue caratteristiche fisiche. L'insieme di dati sparrow è già caricato. L'esito da prevedere è status ("Survived", "Perished"). Le variabili che considereremo sono:

  • total_length: lunghezza dell'uccello dalla punta del becco alla punta della coda (mm)
  • weight: in grammi
  • humerus: lunghezza dell'omero ("osso del braccio" che collega l'ala al corpo) (pollici)

Ricorda che quando usi glm() (docs) per creare un modello di regressione logistica, devi specificare esplicitamente family = binomial:

glm(formula, data = data, family = binomial)

Userai summary() e broom::glance() per vedere funzioni diverse per esaminare un modello di regressione logistica. Una delle diagnostiche che osserverai è l'analogo dell'R-quadrato, chiamato pseudo-\(R^2\).

$$ pseudoR^2 = 1 - \frac{deviance}{null.deviance} $$

Puoi considerare la devianza come analoga alla varianza: è una misura della variazione nei dati categorici. Il pseudo-\(R^2\) è analogo all'\(R^2\) per la regressione standard: l'\(R^2\) misura la "varianza spiegata" di un modello di regressione. Il pseudo-\(R^2\) misura la "devianza spiegata".

Questo esercizio fa parte del corso

Supervised Learning in R: Regression

Visualizza il corso

Istruzioni dell'esercizio

  • Come suggerito nel video, effettuerai la previsione sugli esiti TRUE e FALSE. Crea una nuova colonna survived nel data frame sparrow che sia TRUE quando status == "Survived".
  • Crea la formula fmla che esprime survived come funzione delle variabili di interesse. Stampala.
  • Adatta un modello di regressione logistica per prevedere la probabilità di sopravvivenza dei passeri. Assegna il modello alla variabile sparrow_model.
  • Chiama summary() per vedere i coefficienti del modello, la devianza e la devianza nulla.
  • Chiama glance() sul modello per vedere le devianze e altre diagnostiche in un data frame. Assegna l'output di glance() alla variabile perf.
  • Calcola il pseudo-\(R^2\).

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# sparrow is available
summary(sparrow)

# Create the survived column
sparrow$survived <- ___

# Create the formula
(fmla <- _____)

# Fit the logistic regression model
sparrow_model <- ___

# Call summary
___

# Call glance
(perf <- ___)

# Calculate pseudo-R-squared
(pseudoR2 <- ___)
Modifica ed esegui il codice