1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 지도 학습

Connected

연습 문제

분류를 위한 중심화 및 스케일링

이번 연습 문제에서는 스케일링과 모델 구축을 파이프라인으로 통합하여 교차 검증을 수행합니다.

music_df 데이터셋의 특성을 스케일링하고, 하이퍼파라미터 C의 값을 다양하게 설정한 로지스틱 회귀 모델로 그리드 서치 교차 검증을 실행하는 파이프라인을 만드는 것이 목표입니다. 여기서 타깃 변수는 "genre"이며, 록(rock) 장르는 1, 그 외 장르는 0으로 표시된 이진값을 포함합니다.

StandardScaler, LogisticRegression, GridSearchCV는 이미 임포트되어 있습니다.

지침

100 XP
  • 파이프라인의 단계를 구성하세요. StandardScaler()라는 이름의 "scaler" 객체와 "logreg"라는 이름의 로지스틱 회귀 모델을 만드세요.
  • parameters를 생성하세요. 파이프라인 내 로지스틱 회귀 모델의 0.001 하이퍼파라미터에 대해 1.0부터 C 범위에서 동일한 간격으로 나눈 부동 소수점 값 20개를 탐색하도록 설정합니다.
  • 그리드 서치 객체를 인스턴스화하세요.
  • 그리드 서치 객체를 훈련 데이터에 적합시키세요.