1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning with scikit-learn

Connected

cvičení

Hodnocení klasifikátoru pro předpověď diabetu

V této kapitole budeš pracovat s datasetem diabetes_df, který jsme představili dříve.

Cílem je předpovědět, zda má daný jedinec pravděpodobně diabetes, a to na základě příznaků index tělesné hmotnosti (BMI) a věk (v letech). Jde tedy o binární klasifikační problém. Cílová hodnota 0 znamená, že daný jedinec diabetes nemá, zatímco hodnota 1 znamená, že diabetes má.

diabetes_df je pro tebe předem načten jako pandas DataFrame a rozdělen na X_train, X_test, y_train a y_test. Navíc byl vytvořen objekt KNeighborsClassifier() a přiřazen do proměnné knn.

Natrénuješ model, provedeš predikce na testovací sadě a pak vytvoříš matici záměn a klasifikační zprávu.

Pokyny

100 XP
  • Importuj confusion_matrix a classification_report.
  • Natrénuj model na trénovacích datech.
  • Predikuj štítky testovací sady a výsledky ulož do proměnné y_pred.
  • Vypočítej a vypiš matici záměn a klasifikační zprávu pro testovací štítky v porovnání s predikovanými štítky.