ComeçarComece de graça

Prever a sobrevivência dos pardais

Neste exercício, você vai prever a probabilidade de sobrevivência usando o modelo de sobrevivência dos pardais do exercício anterior.

Lembre-se de que, ao chamar predict() (docs) para obter as probabilidades previstas de um modelo glm(), é preciso especificar que você quer a resposta:

predict(model, type = "response")

Caso contrário, predict() em um modelo de regressão logística retorna os log-odds previstos do evento, e não a probabilidade.

Você também vai usar a função GainCurvePlot() (docs) para traçar a curva de ganho a partir das previsões do modelo. Se a curva de ganho do modelo estiver próxima da curva ideal ("wizard"), então o modelo ordenou bem os pardais: ou seja, o modelo previu que os pardais que de fato sobreviveram teriam uma probabilidade de sobrevivência mais alta. As entradas da função GainCurvePlot() são:

  • frame: data frame com a coluna de predição e a coluna de verdade de terreno
  • xvar: o nome da coluna de previsões (como string)
  • truthVar: o nome da coluna com o desfecho real (como string)
  • title: um título para o gráfico (como string)

GainCurvePlot(frame, xvar, truthVar, title)

O data frame sparrow e o modelo sparrow_model já foram pré-carregados.

Este exercício faz parte do curso

Aprendizado Supervisionado em R: Regressão

Ver curso

Instruções do exercício

  • Crie uma nova coluna em sparrow chamada pred que contenha as previsões nos dados de treinamento.
  • Chame GainCurvePlot() para criar a curva de ganho das previsões. O modelo faz um bom trabalho ao ordenar os pardais conforme eles realmente sobreviveram ou não?

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# sparrow is available
summary(sparrow)

# sparrow_model is available
summary(sparrow_model)

# Make predictions
sparrow$pred <- ___

# Look at gain curve
___(___, ___, ___, "sparrow survival model")
Editar e executar o código