IniziaInizia gratis

Suddividi in train e test

Ora che abbiamo un dataframe, possiamo applicare le tecniche standard di modellazione. In questo esercizio, suddividerai i dati in training set e test set.

Questo esercizio fa parte del corso

Analitica predittiva con dati di rete in R

Visualizza il corso

Istruzioni dell'esercizio

  • Per assicurare la riproducibilità dei risultati, imposta un seed a 7 utilizzando set.seed().
  • Usa la funzione sample() per estrarre due terzi dei numeri dalla sequenza che copre l'intervallo del numero totale di righe in studentnetworkdata. Chiama questo vettore index_train.
  • Crea il training set includendo le righe di studentnetworkdata i cui indici sono in index_train e chiamalo training_set.
  • Crea il test set escludendo le righe di studentnetworkdata i cui indici sono in index_train e chiamalo test_set.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Set the seed
set.seed(___)

# Creat the index vector
index_train <- sample(1:nrow(___), 2 / 3 * nrow(___))

# Make the training set
training_set <- ___[index_train,]

# Make the test set
___ <- ___[-index_train,]
Modifica ed esegui il codice