1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do regresji z użyciem statsmodels w Pythonie

Connected

ćwiczenie

Eksploracja zmiennych objaśniających

Gdy zmienna odpowiedzi jest logiczna, wszystkie punkty leżą na prostych \(y=0\) i \(y=1\), co utrudnia analizę danych. W filmie – dopóki nie pojawiła się linia trendu – trudno było ocenić, jak zmienna objaśniająca rozkłada się na każdej z tych prostych. Rozwiązaniem jest histogram zmiennej objaśniającej z podziałem według zmiennej odpowiedzi.

Dzięki tym histogramom lepiej poznasz zbiór danych dotyczący rezygnacji klientów z usług finansowych, który pojawił się w filmie.

churn jest dostępny jako ramka danych pandas.

Instrukcje 1/2

undefined XP
  • 1

    Wywołaj sns.displot() na danych churn i narysuj dwa histogramy kolumny time_since_last_purchase – po jednym dla każdej wartości zmiennej has_churned.

  • 2

    Narysuj ponownie histogramy, tym razem używając kolumny time_since_first_purchase, z podziałem na każdą wartość zmiennej has_churned.