MulaiMulai sekarang secara gratis

Membangun pengklasifikasi diabetes

Anda akan menggunakan himpunan data diabetes Pima Indians untuk memprediksi apakah seseorang mengidap diabetes dengan logistic regression. Terdapat 8 fitur dan satu target dalam himpunan data ini. Data telah dipisahkan menjadi himpunan pelatihan dan uji serta sudah dimuat untuk Anda sebagai X_train, y_train, X_test, dan y_test.

Sebuah instance StandardScaler() telah didefinisikan sebelumnya sebagai scaler dan LogisticRegression() sebagai lr.

Latihan ini adalah bagian dari kursus

Pengurangan Dimensi dengan Python

Lihat Kursus

Petunjuk latihan

  • Fit penstandar skala pada fitur pelatihan dan transformasikan fitur tersebut sekaligus.
  • Fit model logistic regression pada data pelatihan yang telah diskalakan.
  • Skalasikan fitur uji.
  • Prediksi keberadaan diabetes pada himpunan uji yang telah diskalakan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)

# Fit the logistic regression model on the scaled training data
lr.____(____, ____)

# Scale the test features
X_test_std = scaler.____(____)

# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)

# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))
Edit dan Jalankan Kode