De gain-curve om het werkloosheidsmodel te evalueren
In de vorige oefening heb je voorspellingen gemaakt voor female_unemployment en de voorspellingen en residuen gevisualiseerd.
Nu ga je ook de gain-curve plotten van de voorspellingen van unemployment_model tegenover de werkelijke female_unemployment met de functie WVPlots::GainCurvePlot() (docs).
Voor situaties waarin de volgorde belangrijker is dan de exacte waarden, helpt de gain-curve je te controleren of de voorspellingen van het model in dezelfde volgorde staan als de echte uitkomst.
Aanroepen van de functie GainCurvePlot() zien er zo uit:
GainCurvePlot(frame, xvar, truthvar, title)
waarbij
frameeen data frame isxvarentruthvarstrings zijn met de namen van de kolommen inframevoor respectievelijk de voorspelling en de werkelijke uitkomsttitlede titel van de plot is
Als de voorspellingen exact in dezelfde volgorde staan, is de relatieve Gini-coëfficiënt 1. Als het model slecht sorteert, is de relatieve Gini-coëfficiënt dicht bij nul of zelfs negatief.
Het data frame unemployment, dat ook de voorspellingen bevat, en het model unemployment_model zijn beschikbaar om te gebruiken.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Laad het pakket
WVPlotsmetlibrary(). - Plot de gain-curve. Geef de plot de titel "Unemployment model". Sorteren de voorspellingen van het model correct?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# unemployment (with predictions) is available
summary(unemployment)
# unemployment_model is available
summary(unemployment_model)
# Load the package WVPlots
___
# Plot the Gain Curve
___(___, ___, ___, "Unemployment model")