1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do regresji z użyciem statsmodels w Pythonie

Connected

ćwiczenie

Obliczanie macierzy pomyłek

Macierz pomyłek (ang. confusion matrix, nazywana też tablicą pomyłek) stanowi podstawę wszystkich miar wydajności modeli z kategoryczną zmienną odpowiedzi (takich jak regresja logistyczna). Zawiera liczby wystąpień każdej kombinacji rzeczywistej i przewidywanej odpowiedzi. W tym przypadku, gdy możliwe są dwie odpowiedzi (odejście klienta lub jego brak), mamy cztery możliwe wyniki.

  1. Prawdziwie dodatni: Klient odszedł i model to przewidział.
  2. Fałszywie dodatni: Klient nie odszedł, ale model przewidział, że odejdzie.
  3. Prawdziwie ujemny: Klient nie odszedł i model to przewidział.
  4. Fałszywie ujemny: Klient odszedł, ale model przewidział, że nie odejdzie.

Dostępne są: churn oraz mdl_churn_vs_relationship.

Instrukcje

100 XP
  • Pobierz rzeczywiste odpowiedzi, wybierając kolumnę has_churned ze zbioru danych. Przypisz wynik do zmiennej actual_response.
  • Pobierz z modelu „najbardziej prawdopodobne" przewidywane odpowiedzi. Przypisz wynik do zmiennej predicted_response.
  • Utwórz DataFrame z actual_response i predicted_response. Przypisz wynik do zmiennej outcomes.
  • Wyświetl outcomes jako tabelę liczności reprezentującą macierz pomyłek. Ta część została już za ciebie napisana.