IniziaInizia gratis

Crea i fold

Suddividere i dati una sola volta in insiemi di training e test comporta incertezze statistiche: c’è una piccola possibilità che il tuo test set contenga solo fave con valutazioni alte, mentre tutte quelle con valutazioni basse finiscono nel training set. Significa anche che puoi misurare la performance del tuo modello una sola volta.

La cross-validation ti fornisce una stima più solida delle prestazioni out-of-sample senza questi tranelli statistici: valuta il tuo modello in modo più approfondito.

In questo esercizio creerai dei fold dei dati di training chocolate_train, già precaricati.

Questo esercizio fa parte del corso

Machine Learning con modelli ad albero in R

Visualizza il corso

Istruzioni dell'esercizio

  • Imposta un seed pari a 20 per la riproducibilità.
  • Crea 10 fold di chocolate_train e salva il risultato come chocolate_folds.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Set seed for reproducibility
___

# Build 10 folds
chocolate_folds <- ___(___, v = ___)

print(chocolate_folds)
Modifica ed esegui il codice