1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình Tuyến tính Tổng quát (GLM) trong Python

Connected

Bài tập

Kiểu dữ liệu và họ phân phối

Trong bài học này, bạn đã tìm hiểu các kiểu dữ liệu có thể được mô hình hóa bằng mô hình tuyến tính tổng quát (GLM). Trong bài tập này, bạn sẽ ôn lại các kiểu dữ liệu và áp dụng đúng họ phân phối để khớp một GLM.

Hướng dẫn 1/3

undefined XP
    1
    2
    3

Câu hỏi

Xem xét một nghiên cứu trong đó bạn cố gắng dự đoán số lượt xe đạp băng qua cầu Brooklyn ở New York dựa trên nhiệt độ hằng ngày.

Hãy dùng Console để xem 5 dòng đầu của tập dữ liệu bike, trong đó chứa các biến của bạn. Bạn có thể dùng hàm head() của pandas cho việc này.

Trong dữ liệu, bạn sẽ thấy các biến cần thiết để huấn luyện mô hình. Hai biến bạn cần là:

  1. Brooklyn_B: số lượt xe đạp băng qua cầu Brooklyn
  2. Avg_Temp: nhiệt độ trung bình hằng ngày ở New York City

Bạn trực quan hóa dữ liệu bằng biểu đồ phân tán và thu được như sau:

Bạn quyết định khớp một mô hình GLM. Xét biến phản hồi, số lượt xe đạp băng qua cầu, bạn sẽ chọn họ phân phối nào để khớp mô hình GLM?

Các phương án trả lời