ComeçarComece de graça

Divida em treino e teste

Agora que temos um dataframe, podemos aplicar técnicas padrão de modelagem. Neste exercício, você vai dividir os dados em conjuntos de treino e teste.

Este exercício faz parte do curso

Análise Preditiva com Dados em Rede em R

Ver curso

Instruções do exercício

  • Para garantir a reprodutibilidade dos seus resultados, defina a semente como 7 usando set.seed().
  • Use a função sample() para amostrar dois terços dos números da sequência que vai do total de linhas de studentnetworkdata. Dê a este vetor o nome index_train.
  • Crie o conjunto de treino incluindo as linhas de studentnetworkdata que estão em index_train e nomeie-o training_set.
  • Crie o conjunto de teste excluindo as linhas de studentnetworkdata que estão em index_train e nomeie-o test_set.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Set the seed
set.seed(___)

# Creat the index vector
index_train <- sample(1:nrow(___), 2 / 3 * nrow(___))

# Make the training set
training_set <- ___[index_train,]

# Make the test set
___ <- ___[-index_train,]
Editar e executar o código