1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Hồi quy bằng R

Connected

Bài tập

Khám phá các biến giải thích

Khi biến phản hồi là kiểu logic, mọi điểm dữ liệu đều nằm trên hai đường y bằng 0 và y bằng 1, khiến bạn khó quan sát điều gì đang xảy ra. Trong video, cho đến khi bạn thấy đường xu hướng, vẫn chưa rõ biến giải thích phân bố như thế nào trên mỗi đường. Ta có thể giải quyết điều này bằng biểu đồ histogram của biến giải thích, phân mảnh (facet) theo biến phản hồi.

Bạn sẽ dùng các biểu đồ histogram này để làm quen với bộ dữ liệu rời bỏ dịch vụ tài chính đã thấy trong video.

churn đã sẵn có và ggplot2 đã được nạp.

Hướng dẫn 1/2

undefined XP
  • 1

    Dùng churn, vẽ time_since_last_purchase dưới dạng histogram với binwidth bằng 0.25, phân mảnh theo lưới với has_churned trên mỗi hàng.

  • 2

    Vẽ lại biểu đồ với time_since_first_purchase. Tức là, dùng churn, vẽ time_since_first_purchase dưới dạng histogram với binwidth bằng 0.25, phân mảnh theo lưới với has_churned trên mỗi hàng.