1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 statsmodels로 살펴보는 회귀 소개

Connected

연습 문제

설명 변수 살펴보기

반응 변수가 논리형일 때는 모든 점이 $y=0$과 \(y=1\) 선 위에 놓여서, 무슨 일이 일어나는지 파악하기가 어렵습니다. 영상에서도 추세선을 보기 전까지는 각 선에서 설명 변수가 어떻게 분포하는지 명확하지 않았죠. 이 문제는 반응 변수별로 그룹화한 설명 변수의 히스토그램으로 해결할 수 있습니다.

이 히스토그램을 사용해 영상에서 본 금융 서비스 이탈(churn) 데이터셋을 살펴보겠습니다.

churn은 pandas DataFrame으로 제공됩니다.

지침 1/2

undefined XP
  • 1

    churn 데이터에 대해 sns.displot()을 호출해 time_since_last_purchase를 각 has_churned 값별로 나눠 두 개의 히스토그램으로 그리세요.

  • 2

    time_since_first_purchase 열을 사용해 히스토그램을 다시 그리고, 각 has_churned 값별로 나누세요.