1. 학습
  2. /
  3. 강의
  4. /
  5. Introducere în regresia cu statsmodels în Python

Connected

연습 문제

Explorarea variabilelor explicative

Atunci când variabila răspuns este logică, toate punctele se află pe liniile \(y=0\) și \(y=1\), ceea ce face dificilă înțelegerea distribuției datelor. În video, până când ai văzut linia de tendință, nu era clar cum era distribuită variabila explicativă pe fiecare linie. O soluție este să folosești o histogramă a variabilei explicative, grupată după variabila răspuns.

Vei folosi aceste histograme pentru a te familiariza cu setul de date privind renunțarea la servicii financiare, prezentat în video.

churn este disponibil ca DataFrame pandas.

지침 1/2

undefined XP
  • 1

    Într-un apel sns.displot() pe datele din churn, trasează time_since_last_purchase sub forma a două histograme, împărțite pentru fiecare valoare a lui has_churned.

  • 2

    Redesenează histogramele folosind coloana time_since_first_purchase, împărțite pentru fiecare valoare a lui has_churned.