MulaiMulai sekarang secara gratis

Menilai pengklasifikasi prediksi diabetes

Pada bab ini Anda akan bekerja dengan himpunan data diabetes_df yang telah diperkenalkan sebelumnya.

Tujuannya adalah memprediksi apakah setiap individu kemungkinan memiliki diabetes atau tidak berdasarkan fitur body mass index (BMI) dan usia (dalam tahun). Oleh karena itu, ini adalah masalah klasifikasi biner. Nilai target 0 menunjukkan bahwa individu tersebut tidak memiliki diabetes, sedangkan nilai 1 menunjukkan bahwa individu tersebut memiliki diabetes.

diabetes_df telah dimuat sebelumnya untuk Anda sebagai pandas DataFrame dan dibagi menjadi X_train, X_test, y_train, dan y_test. Selain itu, sebuah KNeighborsClassifier() telah diinisialisasi dan ditetapkan ke knn.

Anda akan melatih model, membuat prediksi pada himpunan uji, kemudian menghasilkan confusion matrix dan classification report.

Latihan ini adalah bagian dari kursus

Supervised Learning dengan scikit-learn

Lihat Kursus

Petunjuk latihan

  • Impor confusion_matrix dan classification_report.
  • Latih model pada data pelatihan.
  • Prediksi label himpunan uji, lalu simpan hasilnya sebagai y_pred.
  • Hitung dan cetak confusion matrix dan classification report untuk label uji dibandingkan label prediksi.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import confusion matrix
____

knn = KNeighborsClassifier(n_neighbors=6)

# Fit the model to the training data
____

# Predict the labels of the test data: y_pred
y_pred = ____

# Generate the confusion matrix and classification report
print(____(____, ____))
print(____(____, ____))
Edit dan Jalankan Kode