1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

연습 문제

모델을 학습해 봅시다

모델 사양(specification)은 화가에게 캔버스가 되는 것처럼 좋은 출발점입니다. 하지만 화가에게 물감이 필요하듯, 사양에는 데이터가 필요합니다. 예측을 할 수 있는 것은 최종 모델뿐입니다:

모델 사양 + 데이터 = 모델

이번 연습에서는 건강 변수를 예측 변수로 사용해 당뇨병 위험을 모델링하는 의사결정나무를 학습합니다. 반응 변수 outcome 은 환자에게 당뇨병이 있는지 여부를 나타내므로, 이는 이진 분류 문제입니다(두 개의 클래스). 데이터셋에는 blood_pressure, age, bmi 같은 환자의 건강 변수도 포함되어 있습니다.

이 강의의 나머지 부분에서는 tidymodels 패키지가 항상 미리 로드됩니다. 이번 연습에서는 diabetes 데이터셋도 작업 공간에서 사용하실 수 있습니다.

지침

100 XP
  • rpart 엔진을 사용하는 의사결정나무 사양 tree_spec 을 생성하세요.
  • diabetes 데이터셋을 해당 사양에 적합하여, outcome 이 bmi 예측 변수에만 의존하도록 모델 tree_model_bmi 를 학습하세요.
  • 모델을 콘솔에 출력하세요.