1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Ngôn ngữ lập trình R

Connected

Bài tập

Kiểu dữ liệu factor là gì và tại sao dùng nó?

Trong chương này, chúng ta sẽ tìm hiểu factor.

Factor là một kiểu dữ liệu thống kê dùng để lưu trữ các biến phân loại (categorical variable). Sự khác biệt giữa biến phân loại và biến liên tục (continuous variable) là: biến phân loại chỉ có một số lượng nhóm hữu hạn, còn biến liên tục có thể nhận vô số giá trị.

Việc cho R biết nó đang xử lý biến liên tục hay biến phân loại là rất quan trọng vì các mô hình thống kê mà ta xây dựng sau này sẽ xử lý hai loại biến này theo những cách khác nhau. (Bạn sẽ hiểu rõ lý do ở phần sau.)

Một ví dụ điển hình của biến phân loại là giới tính. Trong hầu hết các trường hợp, chúng ta có thể chia giới tính thành "Male" và "Female". (Đôi khi có thể cần các nhóm khác. Ví dụ như biến thể nhiễm sắc thể, động vật lưỡng tính hoặc tuỳ theo các chuẩn mực văn hoá khác nhau, nhưng số nhóm vẫn luôn hữu hạn.)

Hướng dẫn

100 XP

Gán giá trị "factors" cho biến theory