1. Learn
  2. /
  3. Courses
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

Exercise

Random Forest로 보간하기

Machine Learning 기반 보간은 전통적인 통계 모형에 비해 더 정확하고 구현도 쉬울 수 있어요. 우선, 변수 간의 관계를 직접 지정할 필요가 없고, random forest 같은 Machine Learning 모델은 매우 복잡하고 비선형적인 관계를 스스로 찾아 결측값 예측에 활용할 수 있어요.

이번 연습 문제에서는 각 변수를 대상으로 결측값을 예측하기 위해 개별 random forest를 구축하는 missForest 패키지를 사용해 보겠습니다. 이전에 다뤘던 전기영화 데이터인 biopics에 보간 함수를 적용한 뒤, 채워진 데이터와 추정된 보간 오차를 각각 추출할 거예요.

이제 random forest를 심어 볼까요?

Instructions

100 XP
  • missForest 패키지를 불러오세요.
  • missForest()로 biopics 데이터의 결측값을 보간하고, 결과를 imp_res에 저장하세요.
  • imp_res에서 보간된 데이터셋을 추출해 imp_data에 할당하고, 결측값 개수가 실제로 0인지 확인하세요.
  • imp_res에서 추정된 보간 오차를 추출해 imp_err에 할당하고, 콘솔에 출력하세요.