Xây dựng bộ phân loại bệnh tiểu đường

Bạn sẽ dùng bộ dữ liệu Pima Indians diabetes để dự đoán một người có mắc tiểu đường hay không bằng logistic regression. Bộ dữ liệu có 8 đặc trưng và một mục tiêu. Dữ liệu đã được chia thành tập huấn luyện và kiểm tra, và đã được nạp sẵn dưới dạng X_train, y_train, X_test, và y_test.

Một thực thể StandardScaler() đã được định nghĩa sẵn là scaler và một thực thể LogisticRegression() là lr.