1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

Bài tập

ROC 곡선 그리기

영상에서 보셨듯이, ROC 곡선은 가능한 모든 임곗값에서 분류기의 성능을 요약해 주는 매우 유용한 도구입니다. 이를 통해 여러 임곗값에 대해 일일이 클래스 예측을 계산하고 각 경우의 혼동 행렬을 살펴보는 번거로운 작업을 줄일 수 있어요.

ROC 곡선을 계산할 때 제가 선호하는 패키지는 caTools이며, 여기에 colAUC() 함수가 포함되어 있습니다. 이 함수는 사용하기 쉽고, 실제로 한 번에 여러 예측 변수의 ROC 곡선을 계산할 수도 있습니다. 이번에는 하나의 예측 변수에 대한 ROC 곡선만 계산하면 되므로, 예시는 다음과 같습니다:

colAUC(predicted_probabilities, actual, plotROC = TRUE)

이 함수는 AUC라는 점수(자세한 내용은 뒤에서 다룹니다)를 반환하고, plotROC = TRUE 인자를 사용하면 시각적으로 확인할 수 있도록 ROC 곡선 그림을 표시합니다.

Hướng dẫn

100 XP

이전 연습 문제에서 사용한 소나(sonar) 데이터의 model, test, train이 작업 공간에 로드되어 있습니다.

  • 테스트 세트에 대해 확률을 예측하세요(즉, type = "response") 그리고 결과를 p에 저장하세요.
  • 예측한 테스트 세트 확률로 ROC 곡선을 만드세요.