Aan de slagGa gratis aan de slag

Maak een cross-validatieplan

Er zijn verschillende manieren om een n-voudig cross-validatieplan te maken. In deze oefening maak je zo’n plan met vtreat::kWayCrossValidation() en bekijk je het resultaat.

kWayCrossValidation() maakt een cross-validatieplan met de volgende aanroep:

splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)

waarbij nRows het aantal rijen aan data is dat je wilt splitsen, en nSplits het gewenste aantal cross-validatie-folds.

Strikt genomen worden dframe en y niet gebruikt door kWayCrossValidation; ze zijn aanwezig voor compatibiliteit met andere vtreat-functies voor datasplitsing. Je kunt ze allebei op NULL zetten.

De resulterende splitPlan is een lijst met nSplits elementen; elk element bevat twee vectoren:

  • train: de indexen van dframe die de trainingsset vormen
  • app: de indexen van dframe die de test- (of applicatie-) set vormen

In deze oefening maak je een 3-voudig cross-validatieplan voor de gegevensset mpg.

Deze oefening maakt deel uit van de cursus

Supervised Learning in R: Regressie

Cursus bekijken

Oefeninstructies

  • Laad het pakket vtreat.
  • Haal het aantal rijen in mpg op en ken dit toe aan de variabele nRows.
  • Roep kWayCrossValidation aan om een 3-voudig cross-validatieplan te maken en ken dit toe aan de variabele splitPlan.
    • Je kunt de laatste twee argumenten van de functie op NULL zetten.
  • Roep str() aan om de structuur van splitPlan te bekijken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the package vtreat
___

# mpg is available
summary(mpg)

# Get the number of rows in mpg
nRows <- ___

# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___

# Examine the split plan
___
Code bewerken en uitvoeren