IniziaInizia gratis

Crea un piano di cross validation

Ci sono diversi modi per implementare un piano di cross validation a n fold. In questo esercizio creerai un piano di questo tipo usando vtreat::kWayCrossValidation() e lo esaminerai.

kWayCrossValidation() crea un piano di cross validation con la seguente chiamata:

splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)

dove nRows è il numero di righe dei dati da suddividere e nSplits è il numero desiderato di fold di cross validation.

A rigor di termini, dframe e y non sono usati da kWayCrossValidation; sono presenti per compatibilità con altre funzioni di partizionamento dei dati di vtreat. Puoi impostarli entrambi a NULL.

Il splitPlan risultante è una lista di nSplits elementi; ciascun elemento contiene due vettori:

  • train: gli indici di dframe che formeranno il training set
  • app: gli indici di dframe che formeranno il test set (o application set)

In questo esercizio creerai un piano di cross validation a 3 fold per l'insieme di dati mpg.

Questo esercizio fa parte del corso

Supervised Learning in R: Regression

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto vtreat.
  • Ottieni il numero di righe in mpg e assegnalo alla variabile nRows.
  • Chiama kWayCrossValidation per creare un piano di cross validation a 3 fold e assegnalo alla variabile splitPlan.
    • Puoi impostare gli ultimi due argomenti della funzione a NULL.
  • Chiama str() per esaminare la struttura di splitPlan.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the package vtreat
___

# mpg is available
summary(mpg)

# Get the number of rows in mpg
nRows <- ___

# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___

# Examine the split plan
___
Modifica ed esegui il codice