1. 学ぶ
  2. /
  3. コース
  4. /
  5. R로 배우는 군집 분석

Connected

演習

범주형 변수 간 거리 계산하기

이 연습 문제에서는 이진(Jaccard) 거리를 계산하는 방법을 살펴보아요. 거리를 계산하려면 먼저 dummies 라이브러리의 dummy.data.frame()을 사용해 범주를 더미 변수로 변환해야 해요.

다음 열을 가진 소규모 설문 관측치 모음 job_survey 데이터 프레임을 사용해요:

  • job_satisfaction 선택지: "Hi", "Mid", "Low"
  • is_happy 선택지: "Yes", "No"

指示

100 XP
  • 더미 변수로 변환한 데이터 프레임 dummy_survey를 생성하세요.
  • 더미화한 설문 데이터에 대해 dist() 함수의 매개변수 method = 'binary'를 사용해 Jaccard 거리 행렬 dist_survey를 생성하세요.
  • 원본 데이터와 거리 행렬을 출력하세요.
    • 원본 데이터에서 거리가 0인 관측치(1, 2, 3)를 확인해 보세요.