1. 학습
  2. /
  3. 강의
  4. /
  5. R로 시작하는 이상치 탐지 입문

Connected

연습 문제

이상치 점수

이전에 만든 시각화를 보면, 비정상적인 호르몬 측정값으로 갑상샘 질환을 감지할 수 있어 보였어요.

이번 연습에서는 isolation forest를 사용해 갑상샘 수치에 대한 이상치 점수를 만들고, 이 점수를 실제 질환 여부와 비교해 보겠습니다.

지침

100 XP
  • thyroid의 호르몬 측정값에 대해 isolation forest를 학습하세요.
  • 갑상샘 데이터의 이상치 점수를 생성하고, 결과를 iso_score라는 새 열로 thyroid에 추가하세요.
  • label 열을 사용해, 갑상샘 질환이 있는 환자와 없는 환자 간 점수 분포를 boxplot()으로 비교하세요.