1. Learn
  2. /
  3. Cursuri
  4. /
  5. Învățare supravegheată cu scikit-learn

Connected

exercițiu

Evaluarea unui clasificator pentru predicția diabetului

În acest capitol vei lucra cu setul de date diabetes_df introdus anterior.

Scopul este să prezici dacă fiecare individ are sau nu diabet, pe baza caracteristicilor indice de masă corporală (IMC) și vârstă (în ani). Prin urmare, este o problemă de clasificare binară. O valoare țintă de 0 indică faptul că individul nu are diabet, în timp ce o valoare de 1 indică faptul că individul are diabet.

diabetes_df a fost preîncărcat ca un DataFrame pandas și împărțit în X_train, X_test, y_train și y_test. În plus, un KNeighborsClassifier() a fost instanțiat și atribuit variabilei knn.

Vei antrena modelul, vei face predicții pe setul de testare, apoi vei genera o matrice de confuzie și un raport de clasificare.

Instrucțiuni

100 XP
  • Importă confusion_matrix și classification_report.
  • Antrenează modelul pe datele de antrenament.
  • Prezice etichetele setului de testare și stochează rezultatele în y_pred.
  • Calculează și afișează matricea de confuzie și raportul de clasificare pentru etichetele de test față de etichetele prezise.