Prever a sobrevivência dos pardais
Neste exercício, você vai prever a probabilidade de sobrevivência usando o modelo de sobrevivência dos pardais do exercício anterior.
Lembre-se de que, ao chamar predict() (docs) para obter as probabilidades previstas de um modelo glm(), é preciso especificar que você quer a resposta:
predict(model, type = "response")
Caso contrário, predict() em um modelo de regressão logística retorna os log-odds previstos do evento, e não a probabilidade.
Você também vai usar a função GainCurvePlot() (docs) para traçar a curva de ganho a partir das previsões do modelo. Se a curva de ganho do modelo estiver próxima da curva ideal ("wizard"), então o modelo ordenou bem os pardais: ou seja, o modelo previu que os pardais que de fato sobreviveram teriam uma probabilidade de sobrevivência mais alta. As entradas da função GainCurvePlot() são:
frame: data frame com a coluna de predição e a coluna de verdade de terrenoxvar: o nome da coluna de previsões (como string)truthVar: o nome da coluna com o desfecho real (como string)title: um título para o gráfico (como string)
GainCurvePlot(frame, xvar, truthVar, title)
O data frame sparrow e o modelo sparrow_model já foram pré-carregados.
Este exercício faz parte do curso
Aprendizado Supervisionado em R: Regressão
Instruções do exercício
- Crie uma nova coluna em
sparrowchamadapredque contenha as previsões nos dados de treinamento. - Chame
GainCurvePlot()para criar a curva de ganho das previsões. O modelo faz um bom trabalho ao ordenar os pardais conforme eles realmente sobreviveram ou não?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# sparrow is available
summary(sparrow)
# sparrow_model is available
summary(sparrow_model)
# Make predictions
sparrow$pred <- ___
# Look at gain curve
___(___, ___, ___, "sparrow survival model")