1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 scikit-learn 的监督学习

Connected

道练习

评估糖尿病预测分类器

在本章中,您将继续使用前面介绍的 diabetes_df 数据集。

目标是基于体质指数(BMI)和年龄(单位为年)这两个特征,预测每位个体是否可能患有糖尿病。因此,这是一个二元分类问题。目标值为 0 表示该个体没有糖尿病,值为 1 表示该个体有糖尿病。

diabetes_df 已为您预先加载为一个 pandas DataFrame,并已拆分为 X_train、X_test、y_train 和 y_test。此外,已实例化一个 KNeighborsClassifier() 并赋值给 knn。

您将拟合模型,在测试集上进行预测,然后生成混淆矩阵和分类报告。

说明

100 XP
  • 导入 confusion_matrix 和 classification_report。
  • 将模型拟合到训练数据。
  • 预测测试集的标签,并将结果保存为 y_pred。
  • 计算并打印测试标签与预测标签的混淆矩阵和分类报告。