1. 学习
  2. /
  3. 课程
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

练习

糖尿病予測分類器の評価

この章では、以前に紹介した diabetes_df データセットを扱います。

目的は、体格指数(BMI)と年齢(年)の特徴量に基づいて、各個人が糖尿病である可能性があるかどうかを予測することです。したがって、これは二値分類の問題です。目的変数が 0 の場合はその個人が糖尿病では「ない」ことを、1 の場合は糖尿病で「ある」ことを示します。

diabetes_df は pandas の DataFrame としてあらかじめ読み込まれており、X_train、X_test、y_train、y_test に分割されています。さらに、KNeighborsClassifier() が生成され、knn に代入されています。

この演習では、モデルを学習させ、テスト集合で予測を行い、その後、混同行列と分類レポートを作成します。

说明

100 XP
  • confusion_matrix と classification_report をインポートします。
  • 学習データにモデルを適合させます。
  • テスト集合のラベルを予測し、結果を y_pred として保存します。
  • 予測ラベルに対するテストラベルの混同行列と分類レポートを計算して表示します。