Diyabet tahmin sınıflandırıcısını değerlendirme
Bu bölümde daha önce tanıtılan diabetes_df veri kümesiyle çalışacaksın.
Amacın, beden kitle indeksi (BMI) ve yaş (yıl cinsinden) özelliklerine göre her bireyin diyabet sahibi olma olasılığını tahmin etmek. Bu nedenle bu bir ikili sınıflandırma problemidir. Hedef değeri 0 olan bireyin diyabeti yoktur, 1 olan bireyin ise diyabeti vardır.
diabetes_df, senin için pandas DataFrame olarak önceden yüklendi ve X_train, X_test, y_train ve y_test olarak ayrıldı. Ayrıca bir KNeighborsClassifier() örneği oluşturuldu ve knn değişkenine atandı.
Modeli eğitecek, test kümesi üzerinde tahmin yapacak ve ardından bir karışıklık matrisi ile sınıflandırma raporu üreteceksin.
Bu egzersiz
scikit-learn ile Supervised Learning
kursunun bir parçasıdırEgzersiz talimatları
confusion_matrixveclassification_reportöğelerini içe aktar.- Modeli eğitim verilerine uydur.
- Test kümesinin etiketlerini tahmin et ve sonuçları
y_predolarak sakla. - Test etiketleri ile tahmin edilen etiketler için karışıklık matrisini ve sınıflandırma raporunu hesaplayıp yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import confusion matrix
____
knn = KNeighborsClassifier(n_neighbors=6)
# Fit the model to the training data
____
# Predict the labels of the test data: y_pred
y_pred = ____
# Generate the confusion matrix and classification report
print(____(____, ____))
print(____(____, ____))