1. Lära sig
  2. /
  3. Courses
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

exercise

KNN 대치와 중앙값 대치 비교

train() 함수의 모든 전처리 단계는 각 교차 검증 폴드의 학습 세트에서 수행되며, 보고되는 오류 지표에는 전처리의 효과가 반영됩니다.

여기에는 사용한 결측값 대치 방법(예: knnImpute 또는 medianImpute)도 포함됩니다. 이는 서로 다른 대치 방법을 비교하고, 범용 성능이 가장 좋은 방법을 선택할 수 있어 유용합니다.

median_model과 knn_model이 워크스페이스에 준비되어 있고, 두 모델의 재표본 결과를 담은 resamples도 제공됩니다. 다음을 호출해 모델의 결과를 확인하세요.

dotplot(resamples, metric = "ROC")

그리고 범용 성능이 가장 좋은 방법을 선택하세요. glm 모델에서 어떤 대치 방법이 범용 ROC 점수가 가장 높나요?

Instruktioner

50 XP

Möjliga svar