1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với Python

Connected

Bài tập

Xây dựng bộ phân loại bệnh tiểu đường

Bạn sẽ dùng bộ dữ liệu Pima Indians diabetes để dự đoán một người có mắc tiểu đường hay không bằng logistic regression. Bộ dữ liệu có 8 đặc trưng và một mục tiêu. Dữ liệu đã được chia thành tập huấn luyện và kiểm tra, và đã được nạp sẵn dưới dạng X_train, y_train, X_test, và y_test.

Một thực thể StandardScaler() đã được định nghĩa sẵn là scaler và một thực thể LogisticRegression() là lr.

Hướng dẫn

100 XP
  • Fit bộ chuẩn hóa trên các đặc trưng huấn luyện và transform các đặc trưng này trong một lần.
  • Fit mô hình logistic regression trên dữ liệu huấn luyện đã chuẩn hóa.
  • Chuẩn hóa (scale) các đặc trưng của tập kiểm tra.
  • Dự đoán sự hiện diện của tiểu đường trên tập kiểm tra đã chuẩn hóa.