1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. R로 배우는 Supervised Learning: 분류

Connected

अभ्यास

범주형 특성 코딩하기

가끔 데이터셋에는 범주형 특성을 나타내는 숫자 값이 들어 있을 수 있어요.

donors 데이터셋의 wealth_rating은 기부자의 부 수준을 숫자로 표시합니다:

  • 0 = Unknown
  • 1 = Low
  • 2 = Medium
  • 3 = High

이 연습 문제에서는 이런 유형의 범주형 특성을 어떻게 준비하는지 보여주고, 로지스틱 회귀 모델에 어떤 영향을 주는지 살펴봅니다. donors 데이터 프레임은 이미 준비되어 있어요.

निर्देश

100 XP
  • 숫자형 wealth_rating에서 factor wealth_levels를 만들고, 표시된 레이블을 사용하세요. factor() 함수에 변환할 열, 개별 level, label을 전달하면 됩니다.
  • relevel()을 사용해 기준 범주를 Medium으로 바꾸세요. 첫 번째 인수는 새로 만든 factor 열이어야 합니다.
  • wealth_levels 열로 donated를 예측하는 로지스틱 회귀 모델을 만들고, summary()로 결과를 출력하세요.