Crea un piano di cross validation
Ci sono diversi modi per implementare un piano di cross validation a n fold. In questo esercizio
creerai un piano di questo tipo usando vtreat::kWayCrossValidation() e lo esaminerai.
kWayCrossValidation() crea un piano di cross validation con la seguente chiamata:
splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)
dove nRows è il numero di righe dei dati da suddividere e nSplits è il numero desiderato di fold di cross validation.
A rigor di termini, dframe e y non sono usati da kWayCrossValidation; sono presenti per compatibilità con altre funzioni di partizionamento dei dati di vtreat. Puoi impostarli entrambi a NULL.
Il splitPlan risultante è una lista di nSplits elementi; ciascun elemento contiene due vettori:
train: gli indici didframeche formeranno il training setapp: gli indici didframeche formeranno il test set (o application set)
In questo esercizio creerai un piano di cross validation a 3 fold per l'insieme di dati mpg.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Carica il pacchetto
vtreat. - Ottieni il numero di righe in
mpge assegnalo alla variabilenRows. - Chiama
kWayCrossValidationper creare un piano di cross validation a 3 fold e assegnalo alla variabilesplitPlan.- Puoi impostare gli ultimi due argomenti della funzione a
NULL.
- Puoi impostare gli ultimi due argomenti della funzione a
- Chiama
str()per esaminare la struttura displitPlan.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the package vtreat
___
# mpg is available
summary(mpg)
# Get the number of rows in mpg
nRows <- ___
# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___
# Examine the split plan
___