1. Учиться
  2. /
  3. Courses
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

Exercise

당뇨병 예측 분류기 평가하기

이번 장에서는 앞에서 소개한 diabetes_df 데이터셋을 사용합니다.

목표는 체질량지수(BMI)와 나이(연 단위) 특성을 바탕으로 각 개인이 당뇨병이 있을 가능성이 있는지 예측하는 것입니다. 따라서 이 문제는 이진 분류 문제입니다. 타깃 값이 0이면 해당 개인에게 당뇨병이 없음을, 값이 1이면 당뇨병이 있음을 의미합니다.

diabetes_df는 pandas DataFrame으로 미리 로드되어 있으며 X_train, X_test, y_train, y_test로 분할되어 있어요. 또한 KNeighborsClassifier()가 인스턴스화되어 knn에 할당되어 있습니다.

모델을 학습시키고 테스트 세트에 대해 예측을 수행한 다음, 혼동 행렬과 분류 보고서를 출력해 볼 거예요.

Инструкции

100 XP
  • confusion_matrix와 classification_report를 임포트하세요.
  • 학습 데이터에 모델을 학습(fit)시키세요.
  • 테스트 세트의 레이블을 예측하고 결과를 y_pred로 저장하세요.
  • 테스트 레이블과 예측 레이블을 비교하여 혼동 행렬과 분류 보고서를 계산하고 출력하세요.