중요한 특성 정렬하기

Decision Tree는 해석 가능성이 높아 매우 인기가 있습니다. 많은 모델이 정확한 예측을 제공할 수 있지만, Decision Tree는 각 특성이 타깃에 미치는 영향을 정량화할 수도 있습니다. 여기서는 어떤 특성이 퇴사 결정에 가장 강한 영향과 가장 약한 영향을 주는지 알려줄 수 있습니다. sklearn에서는 feature_importances_ 속성을 사용해 이 정보를 얻을 수 있습니다.

이 연습 문제에서는 각 특성의 정량화된 중요도를 구해 pandas DataFrame(파이썬식 테이블)에 저장하고, 가장 중요한 것부터 덜 중요한 것 순으로 정렬해 보겠습니다. 이전 연습에서 사용한 model_ best Decision Tree Classifier가 작업 공간에 준비되어 있으며, features_test와 features_train 변수도 제공됩니다.

pandas는 pd로 임포트되어 있습니다.