ComeçarComece de graça

Prever no conjunto de teste

Agora que você tem conjuntos de treino e teste divididos aleatoriamente, pode usar a função lm(), como fez no primeiro exercício, para ajustar um modelo ao seu conjunto de treino, em vez de ao conjunto de dados inteiro. Lembre-se de que você pode usar a interface de fórmula da função de regressão linear para ajustar um modelo com uma variável alvo especificada usando todas as outras variáveis do conjunto de dados como preditoras:

mod <- lm(y ~ ., training_data)

Você pode usar a função predict() para fazer previsões desse modelo em novos dados. O novo conjunto de dados deve ter todas as colunas do conjunto de treino, mas elas podem estar em outra ordem e com valores diferentes. Aqui, em vez de prever novamente no conjunto de treino, você pode prever no conjunto de teste, que não foi usado para treinar o modelo. Isso permitirá que você determine o erro fora da amostra do modelo no próximo exercício:

p <- predict(model, new_data)

Este exercício faz parte do curso

Machine Learning com caret em R

Ver curso

Instruções do exercício

  • Ajuste um modelo lm() chamado model para prever price usando todas as outras variáveis como covariáveis. Lembre-se de usar o conjunto de treino, train.
  • Faça previsões no conjunto de teste, test, usando predict(). Armazene esses valores em um vetor chamado p.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit lm model on train: model


# Predict on test: p
Editar e executar o código