Suddividi in train e test
Ora che abbiamo un dataframe, possiamo applicare le tecniche standard di modellazione. In questo esercizio, suddividerai i dati in training set e test set.
Questo esercizio fa parte del corso
Analitica predittiva con dati di rete in R
Istruzioni dell'esercizio
- Per assicurare la riproducibilità dei risultati, imposta un seed a 7 utilizzando
set.seed(). - Usa la funzione
sample()per estrarre due terzi dei numeri dalla sequenza che copre l'intervallo del numero totale di righe instudentnetworkdata. Chiama questo vettoreindex_train. - Crea il training set includendo le righe di
studentnetworkdatai cui indici sono inindex_traine chiamalotraining_set. - Crea il test set escludendo le righe di
studentnetworkdatai cui indici sono inindex_traine chiamalotest_set.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set the seed
set.seed(___)
# Creat the index vector
index_train <- sample(1:nrow(___), 2 / 3 * nrow(___))
# Make the training set
training_set <- ___[index_train,]
# Make the test set
___ <- ___[-index_train,]