Aan de slagGa gratis aan de slag

Voorspel de overleving van mussen

In deze oefening voorspel je de overlevingskans met het mussensurviemodel uit de vorige oefening.

Onthoud dat je bij het aanroepen van predict() (docs) om de voorspelde kansen uit een glm()-model te krijgen, moet aangeven dat je de response wilt:

predict(model, type = "response")

Doe je dat niet, dan geeft predict() bij een logistische regressie de voorspelde log-odds van de gebeurtenis terug, niet de kans.

Je gebruikt ook de functie GainCurvePlot() (docs) om de gain-curve op basis van de modelvoorspellingen te plotten. Als de gain-curve van het model dicht bij de ideale ("wizard") gain-curve ligt, dan heeft het model de mussen goed gesorteerd: met andere woorden, het model voorspelde voor mussen die daadwerkelijk overleefden een hogere overlevingskans. De inputs van de functie GainCurvePlot() zijn:

  • frame: data frame met predictiekolom en ground-truthkolom
  • xvar: de naam van de kolom met voorspellingen (als string)
  • truthVar: de naam van de kolom met de daadwerkelijke uitkomst (als string)
  • title: een titel voor de plot (als string)

GainCurvePlot(frame, xvar, truthVar, title)

Het sparrow-data frame en het model sparrow_model zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Supervised Learning in R: Regressie

Cursus bekijken

Oefeninstructies

  • Maak een nieuwe kolom in sparrow met de naam pred die de voorspellingen op de trainingsdata bevat.
  • Roep GainCurvePlot() aan om de gain-curve van de voorspellingen te maken. Doet het model het goed in het sorteren van de mussen op wel of niet daadwerkelijk overleefd?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# sparrow is available
summary(sparrow)

# sparrow_model is available
summary(sparrow_model)

# Make predictions
sparrow$pred <- ___

# Look at gain curve
___(___, ___, ___, "sparrow survival model")
Code bewerken en uitvoeren