1. Învăţa
  2. /
  3. Courses
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

exercise

테스트 세트에 예측하기

이제 무작위로 분할한 학습 세트와 테스트 세트를 갖게 되었으니, 첫 번째 연습 문제에서처럼 lm() 함수를 사용하되 전체 데이터셋이 아니라 학습 세트에 모델을 적합해 보세요. 선형 회귀 함수의 formula 인터페이스를 사용하면, 지정한 타깃 변수를 종속변수로 하고 데이터셋의 다른 모든 변수를 예측 변수로 사용해 모델을 적합할 수 있다는 점을 기억하세요:

mod <- lm(y ~ ., training_data)

predict() 함수를 사용하면 해당 모델로 새 데이터에 대한 예측을 만들 수 있어요. 새 데이터셋에는 학습 데이터의 모든 열이 있어야 하지만, 열의 순서나 값은 달라도 됩니다. 여기서는 학습 세트에 다시 예측하는 대신, 모델 학습에 사용하지 않았던 테스트 세트에 대해 예측해 보세요. 그러면 다음 연습 문제에서 이 모델의 샘플 외 오차(out-of-sample error)를 계산할 수 있습니다:

p <- predict(model, new_data)

Instrucţiuni

100 XP
  • 모든 다른 변수를 공변량으로 사용해 price를 예측하는 lm() 모델 model을 적합하세요. 반드시 학습 세트 train을 사용하세요.
  • predict()를 사용해 테스트 세트 test에 대해 예측하세요. 이 값을 p라는 벡터에 저장하세요.