1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 지도 학습

Connected

연습 문제

분류 모델 성능 시각화

이번 연습 문제에서는 분류 문제를 풀어봅니다. "popularity" 데이터셋의 music_df 열은 이진 값으로 변환되어 있으며, 1은 "popularity" 열의 중앙값 이상, 0은 중앙값 미만을 나타냅니다.

세 가지 모델을 구축하고 결과를 시각화하여 곡의 인기 여부를 분류해 보세요.

데이터는 이미 분할 및 스케일링되어 X_train_scaled, X_test_scaled, y_train, y_test로 제공됩니다. 또한 KNeighborsClassifier, DecisionTreeClassifier, LogisticRegression은 이미 임포트되어 있습니다.

지침

100 XP
  • "Logistic Regression", "KNN", "Decision Tree Classifier"를 키로 하는 딕셔너리를 만들고, 각 값에 해당 모델을 할당하세요.
  • models의 값을 순회하는 반복문을 작성하세요.
  • KFold 객체를 생성하여 6번 분할하되, shuffle을 True로, random_state를 12로 설정하세요.
  • 모델, 스케일링된 훈련 특성, 훈련 타깃 세트를 사용하고 cv를 kf로 설정하여 교차 검증을 수행하세요.