IniziaInizia gratis

Cross-validation a 5 fold

In questo corso userai un’ampia varietà di insiemi di dati per esplorare tutta la flessibilità del pacchetto caret. Qui userai il famoso dataset Boston housing, in cui l’obiettivo è prevedere il valore mediano delle case in vari sobborghi di Boston.

Puoi usare esattamente lo stesso codice dell’esercizio precedente, ma cambiando l’insieme di dati usato dal modello:

model <- train(
  medv ~ ., 
  Boston, # <- nuovo!
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Poi, puoi ridurre il numero di fold della cross-validation da 10 a 5 usando l’argomento number di trainControl():

trControl = trainControl(
  method = "cv", 
  number = 5,
  verboseIter = TRUE
)

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza il corso

Istruzioni dell'esercizio

  • Stima un modello lm() sul dataset Boston housing, impostando medv come variabile risposta e tutte le altre come variabili esplicative.
  • Usa una cross-validation a 5 fold invece che a 10 fold.
  • Stampa il modello in console e ispeziona i risultati.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fit lm model using 5-fold CV: model
model <- train(
  ___, 
  ___,
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = ___,
    verboseIter = TRUE
  )
)

# Print model to console
Modifica ed esegui il codice