1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

특성 중요도 시각화하기

이 연습 문제에서는 이전 문제에서 학습한 random forests 회귀 모델 rf에 따르면 어떤 특성들이 예측에 가장 크게 기여했는지 살펴보려고 해요.

이를 위해 rf가 평가한 특성 중요도를 가로 막대그래프로 그려 보겠습니다. 다행히 pandas의 시각화 기능을 이용하면 쉽게 그릴 수 있어요.

우리는 특성 이름을 index로 하고 중요도를 값으로 갖는 pandas.Series 객체 importances를 준비해 두었습니다. 또한 matplotlib.pyplot은 plt, pandas는 pd로 제공돼요.

지침

100 XP
  • importances에 .sort_values() 메서드를 호출하고 결과를 importances_sorted에 할당하세요.

  • importances_sorted에 .plot() 메서드를 호출하고 다음 인자를 설정하세요:

    • kind는 'barh'
    • color는 'lightgreen'