Prevedi la sopravvivenza dei passeri
In questo esercizio, prevederai la probabilità di sopravvivenza usando il modello sui passeri dell'esercizio precedente.
Ricorda che quando chiami predict() (docs) per ottenere le probabilità previste da un modello glm(), devi specificare che vuoi la risposta:
predict(model, type = "response")
Altrimenti, predict() su un modello di regressione logistica restituisce i log-odds previsti dell'evento, non la probabilità.
Userai anche la funzione GainCurvePlot() (docs) per tracciare la curva di gain dalle previsioni del modello. Se la curva di gain del modello è vicina a quella ideale ("wizard"), allora il modello ha ordinato bene i passeri: cioè, ha previsto una probabilità di sopravvivenza più alta per i passeri che effettivamente sono sopravvissuti. Gli input della funzione GainCurvePlot() sono:
frame: data frame con la colonna delle previsioni e la colonna con la verità a terraxvar: il nome della colonna delle previsioni (come stringa)truthVar: il nome della colonna con l'esito reale (come stringa)title: un titolo per il grafico (come stringa)
GainCurvePlot(frame, xvar, truthVar, title)
Il data frame sparrow e il modello sparrow_model sono già stati caricati.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Crea una nuova colonna in
sparrowchiamatapredche contenga le previsioni sui dati di training. - Chiama
GainCurvePlot()per creare la curva di gain delle previsioni. Il modello riesce a ordinare bene i passeri in base al fatto che siano effettivamente sopravvissuti oppure no?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# sparrow is available
summary(sparrow)
# sparrow_model is available
summary(sparrow_model)
# Make predictions
sparrow$pred <- ___
# Look at gain curve
___(___, ___, ___, "sparrow survival model")