Prever no conjunto de teste
Agora que você tem conjuntos de treino e teste divididos aleatoriamente, pode usar a função lm(), como fez no primeiro exercício, para ajustar um modelo ao seu conjunto de treino, em vez de ao conjunto de dados inteiro. Lembre-se de que você pode usar a interface de fórmula da função de regressão linear para ajustar um modelo com uma variável alvo especificada usando todas as outras variáveis do conjunto de dados como preditoras:
mod <- lm(y ~ ., training_data)
Você pode usar a função predict() para fazer previsões desse modelo em novos dados. O novo conjunto de dados deve ter todas as colunas do conjunto de treino, mas elas podem estar em outra ordem e com valores diferentes. Aqui, em vez de prever novamente no conjunto de treino, você pode prever no conjunto de teste, que não foi usado para treinar o modelo. Isso permitirá que você determine o erro fora da amostra do modelo no próximo exercício:
p <- predict(model, new_data)
Este exercício faz parte do curso
Machine Learning com caret em R
Instruções do exercício
- Ajuste um modelo
lm()chamadomodelpara preverpriceusando todas as outras variáveis como covariáveis. Lembre-se de usar o conjunto de treino,train. - Faça previsões no conjunto de teste,
test, usandopredict(). Armazene esses valores em um vetor chamadop.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit lm model on train: model
# Predict on test: p