Prova una suddivisione 80/20
Ora che il tuo insieme di dati è ordinato in modo casuale, puoi suddividerne l’80% iniziale in un training set e il 20% finale in un test set. Puoi farlo scegliendo un punto di divisione circa all’80% del tuo insieme di dati:
split <- round(nrow(mydata) * 0.80)
Puoi poi usare questo punto per estrarre l’80% iniziale dell’insieme di dati come training set:
mydata[1:split, ]
E poi usare lo stesso punto per determinare il test set:
mydata[(split + 1):nrow(mydata), ]
Questo esercizio fa parte del corso
Machine Learning con caret in R
Istruzioni dell'esercizio
- Scegli un indice di riga su cui effettuare la divisione in modo che il punto di split sia circa all’80% dell’insieme di dati
diamonds. Chiama questo indicesplit. - Crea un training set chiamato
trainusando quell’indice. - Crea un test set chiamato
testusando quell’indice.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Determine row to split on: split
# Create train
# Create test