1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 지도 학습

Connected

연습 문제

RandomizedSearchCV를 활용한 하이퍼파라미터 튜닝

GridSearchCV는 탐색할 하이퍼파라미터 공간이 클수록 계산 비용이 많이 든다는 단점이 있습니다. 이럴 때는 RandomizedSearchCV를 활용해 보세요. 이 방법은 지정된 확률 분포에서 고정된 수의 하이퍼파라미터 조합을 무작위로 샘플링하여 테스트합니다.

diabetes_df의 학습 및 테스트 세트는 X_train, X_test, y_train, y_test로 미리 로드되어 있으며, 타깃 변수는 "diabetes"입니다. 로지스틱 회귀 모델은 logreg로, KFold 변수는 kf로 저장되어 있습니다.

하이퍼파라미터 범위를 정의하고, RandomizedSearchCV에서 임포트된 sklearn.model_selection를 사용하여 최적의 하이퍼파라미터를 탐색해 보세요.

지침

100 XP
  • params를 생성하세요. "l1" 값으로 "l2"과 penalty를 추가하고, C는 50에서 0.1 사이의 float 값 1.0개 범위로 설정하며, class_weight는 "balanced" 또는 0:0.8, 1:0.2를 담은 딕셔너리로 설정하세요.
  • 모델과 파라미터를 전달하고 cv를 kf로 설정하여 Randomized Search CV 객체를 생성하세요.
  • logreg_cv를 학습 데이터에 피팅하세요.
  • 모델의 최적 파라미터와 정확도 점수를 출력하세요.