1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 설계하는 Machine Learning 워크플로

Connected

연습 문제

LoF contamination

부정맥 스타트업의 의료 자문가가, 학습 데이터에 존재할 수 있는 모든 유형의 부정맥이 포함되어 있지 않을 수 있다고 알려줍니다. 라벨이 전혀 없는 상태에서 어떻게 다른 유형을 찾아낼 수 있을까요? 라벨 없이도 이상치 탐지기가 건강과 비건강을 구분해 줄 수 있을까요? 우선, 혼동 행렬에 어떤 영향이 있는지 확인하기 위해 contamination 파라미터를 실험해 보겠습니다. LocalOutlierFactor는 lof, numpy는 np, 라벨은 local outlier factor 출력과 동일하게 -1과 1로 인코딩된 ground_truth, 비라벨 학습 데이터는 X로 제공됩니다.

지침 1/3

undefined XP
  • 1

    local outlier factor를 학습하고 X에 대한 예측을 출력한 뒤, 이 예측의 혼동 행렬을 출력하세요.

  • 2

    이번에는 이상치로 표시할 데이터 포인트의 비율을 0.2로 설정하여 반복하세요. 혼동 행렬을 출력하세요.

  • 3

    이제 contamination을 데이터에서 실제 이상치 비율과 동일하게 설정하세요.