1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 Supervised Learning: 회귀

Connected

연습 문제

범주형 입력의 구조 살펴보기

이 연습 문제에서는 model.matrix()(문서)를 호출해, R이 범주형과 수치형 입력을 함께 포함한 데이터를 모델링을 위해 어떻게 표현하는지 살펴보겠습니다. Sleuth3 패키지에서 가져온 flowers 데이터셋이 미리 로드되어 있습니다. 이 데이터에는 다음 열이 있습니다:

  • Flowers: 메도폼(meadowfoam) 식물에서 관찰된 평균 꽃 개수
  • Intensity: 식물에 적용된 광 처리의 강도
  • Time: 범주형 변수 — 생애 주기 중 광 처리가 발생한 시점(Late 또는 Early)

최종 목표는 Time과 Intensity의 함수로서 Flowers를 예측하는 것입니다.

지침

100 XP
  • flowers에 대해 str() 함수를 호출해 각 열의 타입을 확인하세요.
  • flowers$Time 열에 unique() 함수를 사용해 Time이 가질 수 있는 값을 확인하세요. 고유 값은 몇 개인가요?
  • Flowers를 Intensity와 Time의 함수로 표현하는 수식을 만드세요. 변수 fmla에 할당하고 출력하세요.
  • fmla와 model.matrix()를 사용해 데이터 프레임 flowers의 모델 매트릭스를 만드세요. 변수 mmat에 할당하세요.
  • head()를 사용해 flowers의 처음 20줄을 확인하세요.
  • 이제 mmat의 처음 20줄을 확인하세요.
    • 수치형 열 Intensity는 달라졌나요?
    • flowers의 범주형 열 Time은 어떻게 되었나요?
    • Time == 'Early'는 어떻게 표현되나요? Time == 'Late'는요?