1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giới thiệu về Hồi quy với statsmodels trong Python

Connected

Bài tập

Khám phá các biến giải thích

Khi biến phản hồi là kiểu logic, mọi điểm dữ liệu đều nằm trên các đường \(y=0\) và \(y=1\), khiến bạn khó quan sát điều gì đang diễn ra. Trong video, trước khi thấy đường xu hướng, chưa rõ biến giải thích phân bố như thế nào trên mỗi đường. Điều này có thể giải quyết bằng biểu đồ histogram của biến giải thích, được nhóm theo biến phản hồi.

Bạn sẽ dùng các histogram này để làm quen với bộ dữ liệu churn trong dịch vụ tài chính đã thấy trong video.

churn có sẵn dưới dạng một DataFrame của pandas.

Hướng dẫn 1/2

undefined XP
  • 1

    Trong một lần gọi sns.displot() trên dữ liệu churn, vẽ time_since_last_purchase thành hai histogram, tách theo từng giá trị của has_churned.

  • 2

    Vẽ lại các histogram dùng cột time_since_first_purchase, tách theo từng giá trị của has_churned.