Session Ready
Exercise

Factor là gì và tại sao chúng ta lại sử dụng chúng?

Trong chương này, chúng ta sẽ cùng nhau tìm hiểu các biến factors.

Thuật ngữ factor được sử dụng cho loại dữ liệu dùng trong phân tích thống kê được sử dụng để lưu trữ các nhóm. Sự khác biệt cơ bản giữa biến nhóm và biến số là ở chỗ, các giá trị của biến nhóm thuộc một nhóm hữu hạn các giá trị cho trước. Trong khi đó, biến định dạng số có thể có vô số các giá trị (trong một số tài liệu tiếng Việt, còn được gọi là biến yếu tố).

Khi phân tích dữ liệu, việc xác định được đang phân tích biến số hay biến nhóm (factor) là rất quan trọng, bởi lẽ các mô hình phân tích thống kê sẽ xử lý hai định dạng dữ liệu này khác nhau (các bạn sẽ thấy rõ điều nay trong các phần tiếp theo).

Một ví dụ điển hình của biến nhóm là biến 'Giới tính'. Mỗi cá nhân có thể có giới tính là "Nam" hoặc "Nữ". Do đó, "Nam" và "Nữ" là hai giá trị của biến định dạng nhóm "Giới tính", và bất kỳ quan sát nào cũng có thể gán một trong hai giá trị - "Nam" hoặc "Nữ"

Instructions
100 XP

Gán biến theory giá trị của factors for categorical variables.