1. Nauka
  2. /
  3. Kursy
  4. /
  5. Nadzorowane uczenie maszynowe z scikit-learn

Connected

ćwiczenie

Ocena klasyfikatora do przewidywania cukrzycy

W tym rozdziale będziesz pracować ze zbiorem danych diabetes_df, który był już wcześniej omawiany.

Celem jest przewidzenie, czy dana osoba prawdopodobnie ma cukrzycę, na podstawie cech: wskaźnika masy ciała (BMI) oraz wieku (w latach). Jest to zatem problem klasyfikacji binarnej. Wartość docelowa 0 oznacza, że osoba nie ma cukrzycy, natomiast wartość 1 oznacza, że osoba cukrzycę ma.

Zbiór danych diabetes_df został wstępnie załadowany jako DataFrame biblioteki pandas i podzielony na X_train, X_test, y_train oraz y_test. Ponadto zainicjowano KNeighborsClassifier() i przypisano go do zmiennej knn.

Dopasuj model do danych treningowych, wykonaj predykcje na zbiorze testowym, a następnie wygeneruj macierz pomyłek i raport klasyfikacji.

Instrukcje

100 XP
  • Zaimportuj confusion_matrix i classification_report.
  • Dopasuj model do danych treningowych.
  • Przewidź etykiety dla zbioru testowego i zapisz wyniki jako y_pred.
  • Oblicz i wyświetl macierz pomyłek oraz raport klasyfikacji dla etykiet testowych w porównaniu z przewidywanymi etykietami.