LoslegenKostenlos loslegen

Bewertung eines Klassifikators zur Diabetesvorhersage

In diesem Kapitel arbeitest du mit dem schon vorgestellten Datensatz diabetes_df.

Ziel ist es, anhand der Merkmale Body-Mass-Index (BMI) und Alter (in Jahren) vorherzusagen, ob eine Person wahrscheinlich an Diabetes erkrankt ist oder nicht. Es handelt sich also um eine binäre Klassifikation. Ein Zielwert von 0 bedeutet, dass die Person Diabetes nicht hat, während ein Wert von 1 bedeutet, dass die Person Diabetes hat.

diabetes_df wurde bereits als pandas-DataFrame geladen und in X_train, X_test, y_train und y_test aufgeteilt. Außerdem wurde ein KNeighborsClassifier()-Objekt instanziiert und knn zugewiesen.

Du sollst nun das Modell anpassen, Vorhersagen für die Testmenge treffen und dann eine Konfusionsmatrix und einen Klassifikationsbericht erstellen.

Diese Übung ist Teil des Kurses

Überwachtes Lernen mit scikit-learn

Kurs anzeigen

Anleitung zur Übung

  • Importiere confusion_matrix und classification_report.
  • Passe das Modell an die Trainingsdaten an.
  • Sage die Labels der Testdaten voraus und speichere die Ergebnisse als y_pred.
  • Erstelle die Konfusionsmatrix und gib sie zusammen mit dem Klassifikationsbericht für die tatsächlichen Testlabels im Vergleich zu den vorhergesagten Labels aus.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import confusion matrix
____

knn = KNeighborsClassifier(n_neighbors=6)

# Fit the model to the training data
____

# Predict the labels of the test data: y_pred
y_pred = ____

# Generate the confusion matrix and classification report
print(____(____, ____))
print(____(____, ____))
Code bearbeiten und ausführen