Crea i fold
Suddividere i dati una sola volta in insiemi di training e test comporta incertezze statistiche: c’è una piccola possibilità che il tuo test set contenga solo fave con valutazioni alte, mentre tutte quelle con valutazioni basse finiscono nel training set. Significa anche che puoi misurare la performance del tuo modello una sola volta.
La cross-validation ti fornisce una stima più solida delle prestazioni out-of-sample senza questi tranelli statistici: valuta il tuo modello in modo più approfondito.
In questo esercizio creerai dei fold dei dati di training chocolate_train, già precaricati.
Questo esercizio fa parte del corso
Machine Learning con modelli ad albero in R
Istruzioni dell'esercizio
- Imposta un seed pari a 20 per la riproducibilità.
- Crea 10 fold di
chocolate_traine salva il risultato comechocolate_folds.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set seed for reproducibility
___
# Build 10 folds
chocolate_folds <- ___(___, v = ___)
print(chocolate_folds)