1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê với R

Connected

Bài tập

Phân tích khảo sát

Biến phân loại (categorical variable) là biến chỉ nhận một trong một số giá trị hữu hạn.

Hãy luyện xử lý dữ liệu phân loại trước buổi phỏng vấn với bộ dữ liệu survey từ gói MASS. Bộ dữ liệu này ghi lại câu trả lời của sinh viên môn thống kê cho một số câu hỏi.

Một câu hỏi liên quan đến tần suất tập thể dục của sinh viên. Câu trả lời cho câu hỏi này nằm ở cột Exer. Các phương án trả lời gồm:

  • "None"
  • "Some", và
  • "Freq" (thường xuyên).

Lưu ý rằng các câu trả lời này có thể được sắp xếp theo thứ tự.

Nhớ rằng tapply() áp dụng một hàm cho từng nhóm giá trị trong các hạng mục.

Ví dụ,

tapply(survey$Age, survey$Sex, median)

tính trung vị tuổi theo giới.

Bộ dữ liệu đã được nạp sẵn và lưu trong biến survey.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Xem cấu trúc của Exer từ bộ dữ liệu survey; dữ liệu có được sắp thứ tự không?
  • Thêm một factor có thứ bậc dựa trên Exer vào bộ dữ liệu survey.
  • Tính/toàn xem cấu trúc của Exer_ordered.