1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát với scikit-learn

Connected

Bài tập

Đánh giá bộ phân loại dự đoán bệnh tiểu đường

Trong chương này bạn sẽ làm việc với bộ dữ liệu diabetes_df đã được giới thiệu trước đó.

Mục tiêu là dự đoán liệu mỗi cá nhân có khả năng mắc bệnh tiểu đường hay không dựa trên các đặc trưng chỉ số khối cơ thể (BMI) và tuổi (tính bằng năm). Vì vậy, đây là một bài toán phân loại nhị phân. Giá trị đích 0 cho biết cá nhân không mắc bệnh tiểu đường, trong khi giá trị 1 cho biết cá nhân có mắc bệnh tiểu đường.

diabetes_df đã được nạp sẵn dưới dạng pandas DataFrame và tách thành X_train, X_test, y_train và y_test. Ngoài ra, một KNeighborsClassifier() đã được khởi tạo và gán cho knn.

Bạn sẽ huấn luyện mô hình, tạo dự đoán trên tập kiểm tra, sau đó tạo ma trận nhầm lẫn và báo cáo phân loại.

Hướng dẫn

100 XP
  • Import confusion_matrix và classification_report.
  • Fit mô hình với dữ liệu huấn luyện.
  • Dự đoán nhãn của tập kiểm tra và lưu kết quả vào y_pred.
  • Tính và in ra ma trận nhầm lẫn và báo cáo phân loại cho nhãn kiểm tra so với nhãn dự đoán.