Divida em treino e teste
Agora que temos um dataframe, podemos aplicar técnicas padrão de modelagem. Neste exercício, você vai dividir os dados em conjuntos de treino e teste.
Este exercício faz parte do curso
Análise Preditiva com Dados em Rede em R
Instruções do exercício
- Para garantir a reprodutibilidade dos seus resultados, defina a semente como 7 usando
set.seed(). - Use a função
sample()para amostrar dois terços dos números da sequência que vai do total de linhas destudentnetworkdata. Dê a este vetor o nomeindex_train. - Crie o conjunto de treino incluindo as linhas de
studentnetworkdataque estão emindex_traine nomeie-otraining_set. - Crie o conjunto de teste excluindo as linhas de
studentnetworkdataque estão emindex_traine nomeie-otest_set.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set the seed
set.seed(___)
# Creat the index vector
index_train <- sample(1:nrow(___), 2 / 3 * nrow(___))
# Make the training set
training_set <- ___[index_train,]
# Make the test set
___ <- ___[-index_train,]