Aan de slagGa gratis aan de slag

De gain-curve om het werkloosheidsmodel te evalueren

In de vorige oefening heb je voorspellingen gemaakt voor female_unemployment en de voorspellingen en residuen gevisualiseerd. Nu ga je ook de gain-curve plotten van de voorspellingen van unemployment_model tegenover de werkelijke female_unemployment met de functie WVPlots::GainCurvePlot() (docs).

Voor situaties waarin de volgorde belangrijker is dan de exacte waarden, helpt de gain-curve je te controleren of de voorspellingen van het model in dezelfde volgorde staan als de echte uitkomst.

Aanroepen van de functie GainCurvePlot() zien er zo uit:

GainCurvePlot(frame, xvar, truthvar, title)

waarbij

  • frame een data frame is
  • xvar en truthvar strings zijn met de namen van de kolommen in frame voor respectievelijk de voorspelling en de werkelijke uitkomst
  • title de titel van de plot is

Als de voorspellingen exact in dezelfde volgorde staan, is de relatieve Gini-coëfficiënt 1. Als het model slecht sorteert, is de relatieve Gini-coëfficiënt dicht bij nul of zelfs negatief.

Het data frame unemployment, dat ook de voorspellingen bevat, en het model unemployment_model zijn beschikbaar om te gebruiken.

Deze oefening maakt deel uit van de cursus

Supervised Learning in R: Regressie

Cursus bekijken

Oefeninstructies

  • Laad het pakket WVPlots met library().
  • Plot de gain-curve. Geef de plot de titel "Unemployment model". Sorteren de voorspellingen van het model correct?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# unemployment (with predictions) is available
summary(unemployment)

# unemployment_model is available
summary(unemployment_model)

# Load the package WVPlots
___

# Plot the Gain Curve
___(___, ___, ___, "Unemployment model")
Code bewerken en uitvoeren