1. 학습
  2. /
  3. 강의
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

연습 문제

다른 임곗값으로 시도해 보기

이전 연습 문제에서는 예측 확률을 잘라 범주 예측(rock vs mine)을 만들기 위해 0.50의 임곗값을 사용했어요. 그러나 이러한 분류 임곗값이 항상 주어진 모델링 문제의 목표와 일치하는 것은 아닙니다.

예를 들어, 진짜로 지뢰일 가능성이 매우 높은 대상만 식별하고 싶다고 가정해 보세요. 이 경우, 각 예측에 대한 신뢰도를 높이기 위해 0.90의 확률 임곗값을 사용해도 됩니다. 이렇게 하면 예측된 지뢰 수는 적어지지만, 각 예측에 대한 확신은 커집니다.

확률을 예측 범주로 절단한 다음 혼동 행렬을 계산하는 코드 패턴은 이 장의 연습 문제 7에서 보여드렸습니다.

지침

100 XP
  • ifelse()를 사용해 문자 벡터 m_or_r를 만드세요. p가 0.9보다 크면 양성 클래스 "M", 그렇지 않으면 음성 클래스 "R"가 되도록 하세요.
  • m_or_r를 test[["Class"]]와 동일한 수준을 갖는 factor p_class로 변환하세요.
  • confusionMatrix()에 p_class와 test 데이터셋의 "Class" 열을 전달해 혼동 행렬을 만드세요.