1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

연습 문제

분류를 위한 센터링과 스케일링

이제 스케일링과 모델 구축을 하나의 파이프라인으로 묶어 교차 검증을 진행해 보겠습니다.

여러분의 과제는 music_df 데이터셋의 특성들을 스케일링하고, 로지스틱 회귀 모델에서 하이퍼파라미터 C의 서로 다른 값을 사용해 그리드 서치 교차 검증을 수행하는 파이프라인을 만드는 것입니다. 여기서 타깃 변수는 "genre"이며, 록은 1, 그 외 장르는 0의 이진 값으로 구성됩니다.

StandardScaler, LogisticRegression, 그리고 GridSearchCV는 이미 임포트되어 있습니다.

지침

100 XP
  • 파이프라인의 단계를 구성하세요: "scaler"라는 이름의 StandardScaler() 객체와 "logreg"라는 이름의 로지스틱 회귀 모델.
  • 파이프라인 내 로지스틱 회귀 모델의 C 하이퍼파라미터에 대해 0.001에서 1.0까지 균등 간격의 실수 20개를 탐색하도록 parameters를 만드세요.
  • 그리드 서치 객체를 인스턴스화하세요.
  • 그리드 서치 객체를 학습 데이터에 적합(fit)하세요.