Bewertung eines Klassifikators zur Diabetesvorhersage
In diesem Kapitel arbeitest du mit dem schon vorgestellten Datensatz diabetes_df
.
Ziel ist es, anhand der Merkmale Body-Mass-Index (BMI) und Alter (in Jahren) vorherzusagen, ob eine Person wahrscheinlich an Diabetes erkrankt ist oder nicht. Es handelt sich also um eine binäre Klassifikation. Ein Zielwert von 0
bedeutet, dass die Person Diabetes nicht hat, während ein Wert von 1
bedeutet, dass die Person Diabetes hat.
diabetes_df
wurde bereits als pandas-DataFrame geladen und in X_train
, X_test
, y_train
und y_test
aufgeteilt. Außerdem wurde ein KNeighborsClassifier()
-Objekt instanziiert und knn
zugewiesen.
Du sollst nun das Modell anpassen, Vorhersagen für die Testmenge treffen und dann eine Konfusionsmatrix und einen Klassifikationsbericht erstellen.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Importiere
confusion_matrix
undclassification_report
. - Passe das Modell an die Trainingsdaten an.
- Sage die Labels der Testdaten voraus und speichere die Ergebnisse als
y_pred
. - Erstelle die Konfusionsmatrix und gib sie zusammen mit dem Klassifikationsbericht für die tatsächlichen Testlabels im Vergleich zu den vorhergesagten Labels aus.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import confusion matrix
____
knn = KNeighborsClassifier(n_neighbors=6)
# Fit the model to the training data
____
# Predict the labels of the test data: y_pred
y_pred = ____
# Generate the confusion matrix and classification report
print(____(____, ____))
print(____(____, ____))