1. 학습
  2. /
  3. 강의
  4. /
  5. 마케팅 애널리틱스: Python으로 고객 이탈 예측하기

Connected

연습 문제

특성 수 튜닝하기

모델에서 사용하는 기본 하이퍼파라미터는 여러분의 데이터에 최적화되어 있지 않을 수 있어요. 그리드 서치 교차 검증의 목표는 최적의 모델 성능을 내는 하이퍼파라미터를 찾는 것입니다. 영상에서 랜덤 포레스트의 n_estimators 하이퍼파라미터를 어떻게 튜닝하는지 살펴봤죠. 여기서는 max_features 하이퍼파라미터를 튜닝해 보겠습니다. 코드가 빠르게 실행되도록 cv 하이퍼파라미터는 3으로 설정되어 있어요.

Hyperparameter Purpose
max_features 최적 분할을 찾을 때 고려할 특성 수

랜덤 포레스트는 여러 결정 트리로 이루어진 앙상블입니다. n_estimators 하이퍼파라미터는 포레스트에 사용할 트리의 개수를 제어하고, max_features 하이퍼파라미터는 각 결정 트리에서 최적의 분할을 찾을 때 랜덤 포레스트가 고려할 특성의 수를 제어합니다.

랜덤 포레스트 분류기가 clf로 이미 인스턴스화되어 있습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • sklearn.model_selection에서 GridSearchCV를 임포트하세요.