Maak een cross-validatieplan
Er zijn verschillende manieren om een n-voudig cross-validatieplan te maken. In deze oefening
maak je zo’n plan met vtreat::kWayCrossValidation() en bekijk je het resultaat.
kWayCrossValidation() maakt een cross-validatieplan met de volgende aanroep:
splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)
waarbij nRows het aantal rijen aan data is dat je wilt splitsen, en nSplits het gewenste aantal cross-validatie-folds.
Strikt genomen worden dframe en y niet gebruikt door kWayCrossValidation; ze zijn aanwezig voor compatibiliteit met andere vtreat-functies voor datasplitsing. Je kunt ze allebei op NULL zetten.
De resulterende splitPlan is een lijst met nSplits elementen; elk element bevat twee vectoren:
train: de indexen vandframedie de trainingsset vormenapp: de indexen vandframedie de test- (of applicatie-) set vormen
In deze oefening maak je een 3-voudig cross-validatieplan voor de gegevensset mpg.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Laad het pakket
vtreat. - Haal het aantal rijen in
mpgop en ken dit toe aan de variabelenRows. - Roep
kWayCrossValidationaan om een 3-voudig cross-validatieplan te maken en ken dit toe aan de variabelesplitPlan.- Je kunt de laatste twee argumenten van de functie op
NULLzetten.
- Je kunt de laatste twee argumenten van de functie op
- Roep
str()aan om de structuur vansplitPlante bekijken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the package vtreat
___
# mpg is available
summary(mpg)
# Get the number of rows in mpg
nRows <- ___
# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___
# Examine the split plan
___