KNN 대치와 중앙값 대치 비교

train() 함수의 모든 전처리 단계는 각 교차 검증 폴드의 학습 세트에서 수행되며, 보고되는 오류 지표에는 전처리의 효과가 반영됩니다.

여기에는 사용한 결측값 대치 방법(예: knnImpute 또는 medianImpute)도 포함됩니다. 이는 서로 다른 대치 방법을 비교하고, 범용 성능이 가장 좋은 방법을 선택할 수 있어 유용합니다.

median_model과 knn_model이 워크스페이스에 준비되어 있고, 두 모델의 재표본 결과를 담은 resamples도 제공됩니다. 다음을 호출해 모델의 결과를 확인하세요.

dotplot(resamples, metric = "ROC")

그리고 범용 성능이 가장 좋은 방법을 선택하세요. glm 모델에서 어떤 대치 방법이 범용 ROC 점수가 가장 높나요?

KNN 대치는 중앙값 대치보다 훨씬 좋습니다.

KNN 대치는 중앙값 대치보다 약간 좋습니다.

중앙값 대치는 KNN 대치보다 훨씬 좋습니다.

중앙값 대치는 KNN 대치보다 약간 좋습니다.

연습 문제