Prever no conjunto de teste

Agora que você tem conjuntos de treino e teste divididos aleatoriamente, pode usar a função lm(), como fez no primeiro exercício, para ajustar um modelo ao seu conjunto de treino, em vez de ao conjunto de dados inteiro. Lembre-se de que você pode usar a interface de fórmula da função de regressão linear para ajustar um modelo com uma variável alvo especificada usando todas as outras variáveis do conjunto de dados como preditoras:

mod <- lm(y ~ ., training_data)

Você pode usar a função predict() para fazer previsões desse modelo em novos dados. O novo conjunto de dados deve ter todas as colunas do conjunto de treino, mas elas podem estar em outra ordem e com valores diferentes. Aqui, em vez de prever novamente no conjunto de treino, você pode prever no conjunto de teste, que não foi usado para treinar o modelo. Isso permitirá que você determine o erro fora da amostra do modelo no próximo exercício:

p <- predict(model, new_data)

Este exercício faz parte do curso

Machine Learning com caret em R

Ver curso

Instruções do exercício

Ajuste um modelo lm() chamado model para prever price usando todas as outras variáveis como covariáveis. Lembre-se de usar o conjunto de treino, train.
Faça previsões no conjunto de teste, test, usando predict(). Armazene esses valores em um vetor chamado p.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit lm model on train: model


# Predict on test: p

Editar e executar o código