1. 学ぶ
  2. /
  3. コース
  4. /
  5. XGBoost로 익히는 Extreme Gradient Boosting

Connected

演習

특성 중요도 시각화: 내 데이터셋에서 가장 중요한 특성은 무엇일까요

XGBoost 모델을 시각화하는 또 다른 방법은 원본 데이터셋의 각 특성 열이 모델에서 얼마나 중요한지를 살펴보는 것입니다.

가장 간단한 방법 중 하나는 모델의 모든 부스팅 라운드(트리)에서 각 특성이 분할에 사용된 횟수를 세고, 그 결과를 막대 그래프로 시각화하는 것입니다. 이때 특성은 등장 횟수에 따라 정렬됩니다. XGBoost의 plot_importance() 함수는 바로 이 작업을 할 수 있게 해 주며, 이번 연습 문제에서 직접 사용해 보실 거예요!

指示

100 XP
  • 이전과 같이 X와 y에서 DMatrix를 생성하세요.
  • "objective"는 "reg:squarederror", "max_depth"는 4로 하는 파라미터 딕셔너리를 만드세요.
  • 직전 연습 문제와 동일하게 부스팅 라운드를 10으로 하여 모델을 학습하세요.
  • xgb.plot_importance()에 학습된 모델을 전달하여 특성 중요도 그래프를 생성하세요.