1. Învăţa
  2. /
  3. Courses
  4. /
  5. R로 배우는 Machine Learning 기반 마케팅 분석

Connected

exercise

최적 임계값 찾기

고객의 연체를 방지하기 위한 캠페인을 진행한다고 가정해 보세요. 예측 결과를 바탕으로 캠페인을 설계할 수 있고, 이때 임계값 선택이 성과에 큰 영향을 줍니다. 캠페인의 비용과 보상을 알고 있다면, 어떤 임계값이 가장 합리적인지 경험적으로 확인할 수 있어요. 이번 연습에서는 다음과 같은 상황을 다룹니다:

캠페인 덕분에 고객이 연체하지 않게 되고, 즉 연체를 정확히 예측(true positive)했다면 1000€의 보상을 받습니다. 반대로 어차피 연체하지 않을 고객을 대상으로 캠페인을 진행해 잘못 연체로 예측(false positive)한 경우에는 250€의 비용이 듭니다.

이전 연습에서 제한된 모델이 가장 좋다는 것을 확인했죠. 따라서 그 모델에 대해서만 최적 임계값을 계산하세요. 예측값은 defaultData 데이터프레임의 predNew 열에 저장되어 있습니다. SDMTools 패키지를 사용하세요.

Instrucțiuni 1 / 3

undefined XP
    1
    2
    3
  • 연습으로, 임계값 0.5를 사용해 혼동 행렬을 만드세요. 행렬을 확인하고 true positive와 false positive가 어디에 있는지 떠올려 보세요.