1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

연습 문제

속도-정확도 간의 균형

이전 영상에서 랜덤 포레스트의 성능에 영향을 주기 위해 조정할 수 있는 두 가지 설정을 보셨습니다:

  • 각 포레스트의 결정 트리 개수
  • 결정 트리에서 분할에 사용하는 변수 개수

각 값을 늘리면 대체(imputation) 모델의 정확도가 좋아질 수 있지만, 실행 시간도 더 오래 걸립니다. 이번 연습에서는 서로 다른 설정으로 missForest()를 biopics 데이터에 두 번 적용해 보며 이러한 아이디어를 직접 확인해 보겠습니다. 지침을 따라가면서 출력되는 오류(오차)와 코드 실행 시간을 주의 깊게 살펴보세요.

지침 1/2

undefined XP
  • 1
    • missForest()를 biopics에 대해 결정 트리 5개, 분할 변수 2개로 실행하고 대체 오차를 출력하세요.
  • 2
    • missForest()를 biopics에 대해 결정 트리 50개, 분할 변수 6개로 실행하고 대체 오차를 출력하세요.