1. 학습
  2. /
  3. 강의
  4. /
  5. HR Analytics: Python으로 직원 이탈 예측하기

Connected

연습 문제

중요한 특성 정렬하기

Decision Tree는 해석 가능성이 높아 매우 인기가 있습니다. 많은 모델이 정확한 예측을 제공할 수 있지만, Decision Tree는 각 특성이 타깃에 미치는 영향을 정량화할 수도 있습니다. 여기서는 어떤 특성이 퇴사 결정에 가장 강한 영향과 가장 약한 영향을 주는지 알려줄 수 있습니다. sklearn에서는 feature_importances_ 속성을 사용해 이 정보를 얻을 수 있습니다.

이 연습 문제에서는 각 특성의 정량화된 중요도를 구해 pandas DataFrame(파이썬식 테이블)에 저장하고, 가장 중요한 것부터 덜 중요한 것 순으로 정렬해 보겠습니다. 이전 연습에서 사용한 model_ best Decision Tree Classifier가 작업 공간에 준비되어 있으며, features_test와 features_train 변수도 제공됩니다.

pandas는 pd로 임포트되어 있습니다.

지침

100 XP
  • feature_importances_ 속성을 사용해 상대적 특성 중요도를 계산하세요
  • 특성 이름 리스트를 만드세요
  • DataFrame() 함수를 사용해 결과를 DataFrame에 저장하되, 특성은 행으로, 해당 값은 하나의 열로 두세요
  • sort_values() 함수를 사용해 relative_importances DataFrame을 내림차순으로 정렬해 가장 중요한 특성이 위에 오도록 하고, 결과를 출력하세요