1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z PySpark

Connected

ćwiczenie

Oceń model regresji logistycznej

Dokładność (accuracy) zazwyczaj nie jest zbyt wiarygodną metryką, ponieważ może być zaburzona przez najczęściej występującą klasę docelową.

Istnieją dwie inne przydatne metryki:

  • precyzja oraz
  • czułość.

Sprawdź slajdy do tej lekcji, aby zapoznać się z odpowiednimi wzorami.

Precyzja to udział poprawnych predykcji wśród wszystkich predykcji pozytywnych. Innymi słowy: spośród wszystkich lotów przewidzianych jako opóźnione, jaka część faktycznie była opóźniona?

Czułość to udział pozytywnych przypadków, które zostały poprawnie przewidziane. Spośród wszystkich opóźnionych lotów, jaką część model prawidłowo zidentyfikował?

Precyzja i czułość są zazwyczaj wyznaczane względem pozytywnej klasy docelowej. Można jednak obliczyć również ważone wersje tych metryk, które uwzględniają obie klasy docelowe.

Składniki macierzy pomyłek są dostępne jako TN, TP, FN i FP, a także obiekt prediction.

Instrukcje

100 XP
  • Wyznacz precyzję i czułość.
  • Utwórz ewaluator wieloklasowy i oblicz ważoną precyzję.
  • Utwórz ewaluator binarny i oblicz AUC przy użyciu metryki "areaUnderROC".