Prova una suddivisione 80/20

Ora che il tuo insieme di dati è ordinato in modo casuale, puoi suddividerne l’80% iniziale in un training set e il 20% finale in un test set. Puoi farlo scegliendo un punto di divisione circa all’80% del tuo insieme di dati:

split <- round(nrow(mydata) * 0.80)

Puoi poi usare questo punto per estrarre l’80% iniziale dell’insieme di dati come training set:

mydata[1:split, ]

E poi usare lo stesso punto per determinare il test set:

mydata[(split + 1):nrow(mydata), ]

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza corso

Istruzioni dell'esercizio

Scegli un indice di riga su cui effettuare la divisione in modo che il punto di split sia circa all’80% dell’insieme di dati diamonds. Chiama questo indice split.
Crea un training set chiamato train usando quell’indice.
Crea un test set chiamato test usando quell’indice.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Determine row to split on: split


# Create train


# Create test

Modifica ed esegui il codice