Cross-validation a 5 fold
In questo corso userai un’ampia varietà di insiemi di dati per esplorare tutta la flessibilità del pacchetto caret. Qui userai il famoso dataset Boston housing, in cui l’obiettivo è prevedere il valore mediano delle case in vari sobborghi di Boston.
Puoi usare esattamente lo stesso codice dell’esercizio precedente, ma cambiando l’insieme di dati usato dal modello:
model <- train(
medv ~ .,
Boston, # <- nuovo!
method = "lm",
trControl = trainControl(
method = "cv",
number = 10,
verboseIter = TRUE
)
)
Poi, puoi ridurre il numero di fold della cross-validation da 10 a 5 usando l’argomento number di trainControl():
trControl = trainControl(
method = "cv",
number = 5,
verboseIter = TRUE
)
Questo esercizio fa parte del corso
Machine Learning con caret in R
Istruzioni dell'esercizio
- Stima un modello
lm()sul datasetBostonhousing, impostandomedvcome variabile risposta e tutte le altre come variabili esplicative. - Usa una cross-validation a 5 fold invece che a 10 fold.
- Stampa il modello in console e ispeziona i risultati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit lm model using 5-fold CV: model
model <- train(
___,
___,
method = "lm",
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console