예측 만들기

데이터로 예측을 만드는 일은 Machine Learning의 핵심 목표 중 하나입니다. 이제 데이터를 분할하고 모델을 학습하는 법을 알게 되었으니, 학습한 모델로 보지 못한 샘플을 예측해 볼 차례예요.

이번에는 학습 데이터로 트리 사양을 적합해 얻은 모델을 사용해 테스트 세트에 대한 예측을 수행하겠습니다.

작업 공간에는 이전에 생성한 데이터셋(diabetes_train, diabetes_test)과 아래 코드를 사용해 만든 의사결정나무 사양 tree_spec이 준비되어 있습니다:

tree_spec <- decision_tree() %>%
  set_engine("rpart") %>%
  set_mode("classification")

outcome을 타깃 변수로, 모든 예측 변수를 사용해 학습 데이터에 사양을 적합하고 model을 생성하세요.
model을 사용해 테스트 세트의 각 관측치에 대한 당뇨병 결과를 예측하고, 결과를 predictions에 할당하세요.
테스트 세트의 실제 결과를 true_class라는 열로 predictions에 추가하고, 결과를 predictions_combined로 저장하세요.
head() 함수를 사용해 결과의 첫 몇 행을 출력하세요.