1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 차원 축소

Connected

연습 문제

색상에 따른 정보 이득 계산

루트 노드와 자식 노드의 엔트로피를 알게 되었으니, 이제 색상이 제공하는 정보 이득을 계산해 보겠습니다.

이전 연습 문제에서 entropy_root, entropy_left, entropy_right를 계산했으며, 콘솔에서 사용할 수 있습니다.

자식 노드 엔트로피의 가중 평균을 사용해야 함을 기억하세요. 따라서 원래 관측값 중 분할 후 왼쪽과 오른쪽에 각각 얼마나 배정되었는지 비율을 계산해야 합니다. 이 값을 각각 p_left와 p_right에 저장하세요.

decison tree split by color

지침

100 XP
  • 분할 가중치(각 분할 구간에 속한 관측값의 비율)를 계산하세요.
  • 해당 가중치와 엔트로피를 사용해 정보 이득을 계산하세요.