Membangun pengklasifikasi diabetes
Anda akan menggunakan himpunan data diabetes Pima Indians untuk memprediksi apakah seseorang mengidap diabetes dengan logistic regression. Terdapat 8 fitur dan satu target dalam himpunan data ini. Data telah dipisahkan menjadi himpunan pelatihan dan uji serta sudah dimuat untuk Anda sebagai X_train, y_train, X_test, dan y_test.
Sebuah instance StandardScaler() telah didefinisikan sebelumnya sebagai scaler dan LogisticRegression() sebagai lr.
Latihan ini adalah bagian dari kursus
Pengurangan Dimensi dengan Python
Petunjuk latihan
- Fit penstandar skala pada fitur pelatihan dan transformasikan fitur tersebut sekaligus.
- Fit model logistic regression pada data pelatihan yang telah diskalakan.
- Skalasikan fitur uji.
- Prediksi keberadaan diabetes pada himpunan uji yang telah diskalakan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)
# Fit the logistic regression model on the scaled training data
lr.____(____, ____)
# Scale the test features
X_test_std = scaler.____(____)
# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)
# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))