1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 네트워크 데이터 기반 Predictive Analytics

Connected

연습 문제

랜덤 포레스트 모델

이 연습 문제에서는 randomForest 패키지의 randomForest() 함수를 사용해 학습 데이터셋 training_set에 있는 고객의 이탈(churn)을 예측하는 랜덤 포레스트 모델을 구축합니다. 타깃 변수 이름은 Future입니다. 또한 모델에서 변수 중요도를 확인하고 시각화해 보겠습니다.

지침

100 XP
  • randomForest 패키지를 로드하세요.
  • 시드를 863으로 설정하기 위해 set.seed() 함수를 사용하세요.
  • randomForest() 함수를 사용해 training_set의 모든 변수를 활용해 랜덤 포레스트를 구축하세요. 반응 변수 Future는 factor여야 하므로 as.factor() 함수를 활용하세요.
  • varImpPlot()을 사용해 랜덤 포레스트 모델의 변수 중요도를 시각화하세요.