1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình Tuyến tính Tổng quát (GLM) trong Python

Connected

Bài tập

Mô hình hóa với biến phân loại

Trong các bài trước, bạn đã khớp một mô hình hồi quy logistic với color là biến giải thích cùng với width, trong đó bạn xử lý color như một biến định lượng. Ở bài này, bạn sẽ xử lý color như một biến phân loại; khi bạn dựng ma trận mô hình, color sẽ được mã hóa thành 3 biến với mã hóa 0/1.

Nhắc lại: mã hóa mặc định trong dmatrix() dùng nhóm đầu tiên làm nhóm tham chiếu. Để xem ma trận mô hình dưới dạng dataframe, bạn cần truyền thêm đối số return_type trong dmatrix() và đặt là 'dataframe'.

Biến color có thứ tự tự nhiên như sau:
1: medium light
2: medium
3: medium dark
4: dark

Bộ dữ liệu crab đã được nạp sẵn trong không gian làm việc.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Dựng một model_matrix với color là biến. color phải được xử lý như biến phân loại và đặt nhóm tham chiếu là 4 bằng hàm Treatment().
  • Khớp và in kết quả của mô hình logistic với y là biến phản hồi.