IniziaInizia gratis

Prova una suddivisione 80/20

Ora che il tuo insieme di dati è ordinato in modo casuale, puoi suddividerne l’80% iniziale in un training set e il 20% finale in un test set. Puoi farlo scegliendo un punto di divisione circa all’80% del tuo insieme di dati:

split <- round(nrow(mydata) * 0.80)

Puoi poi usare questo punto per estrarre l’80% iniziale dell’insieme di dati come training set:

mydata[1:split, ]

E poi usare lo stesso punto per determinare il test set:

mydata[(split + 1):nrow(mydata), ]

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza il corso

Istruzioni dell'esercizio

  • Scegli un indice di riga su cui effettuare la divisione in modo che il punto di split sia circa all’80% dell’insieme di dati diamonds. Chiama questo indice split.
  • Crea un training set chiamato train usando quell’indice.
  • Crea un test set chiamato test usando quell’indice.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Determine row to split on: split


# Create train


# Create test
Modifica ed esegui il codice