1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

演習

분류 모델 성능 시각화

이 연습 문제에서는 music_df 데이터셋의 "popularity" 열을 이진값으로 변환한 분류 문제를 해결합니다. 여기서 1은 "popularity" 열의 중앙값 이상인 경우, 0은 중앙값 미만인 경우를 나타냅니다.

여러분의 과제는 노래가 인기 있는지 여부를 분류하기 위해 세 가지 서로 다른 모델을 구축하고 그 결과를 시각화하는 것입니다.

데이터는 이미 X_train_scaled, X_test_scaled, y_train, y_test로 분할 및 스케일링되어 로드되어 있습니다. 또한 KNeighborsClassifier, DecisionTreeClassifier, LogisticRegression가 임포트되어 있습니다.

指示

100 XP
  • "Logistic Regression", "KNN", "Decision Tree Classifier"를 키로 하고, 각 모델을 호출한 값을 값으로 가지는 딕셔너리를 만드세요.
  • models의 값들을 순회하세요.
  • 분할 수를 6으로 하고, shuffle을 True, random_state를 12로 설정한 KFold 객체를 인스턴스화하세요.
  • 해당 모델, 스케일링된 학습 특징, 타깃 학습 세트를 사용하고, cv를 kf로 설정하여 교차 검증을 수행하세요.