1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình Tuyến tính Tổng quát (GLM) trong Python

Connected

Bài tập

Mã hóa biến phân loại

Ở các bài trước, bạn đã luyện tạo ma trận mô hình cho biến liên tục và áp dụng biến đổi biến. Trong bài này, bạn sẽ luyện các cách mã hóa một biến phân loại.

Dữ liệu phân loại giúp bạn phân tích và so sánh mối quan hệ giữa các nhóm hay yếu tố khác nhau. Vì vậy, việc chọn nhóm tham chiếu là quan trọng và, tùy nghiên cứu cụ thể, bạn có thể muốn thay đổi nhóm tham chiếu so với mặc định. Một lý do thường gặp để thay đổi nhóm tham chiếu là để diễn giải các hệ số ước lượng phù hợp và thú vị hơn với bối cảnh nghiên cứu.

Trong bài này, bạn sẽ quay lại bộ dữ liệu crab, trong đó color và spine là các biến phân loại.

Bộ dữ liệu crab đã được nạp sẵn trong không gian làm việc.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Import dmatrix từ patsy.
  • Dùng dmatrix() để tạo và in ra ma trận mô hình với color là biến phân loại bằng hàm C().