1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập dữ liệu nâng cao trong R

Connected

Bài tập

Bạn hiểu dữ liệu của mình đến đâu?

Bài trước nói về các chỉ số kinh tế – xã hội và khả năng tiếp cận giáo dục của những cá nhân khác nhau. Bộ dữ liệu edu_equal_1 mà bạn đã tạo sẵn có trong workspace. Khi đã có nó trong R, việc rút ra vài nhận định cơ bản khá dễ.

Chẳng hạn, bạn có thể tự hỏi có bao nhiêu quan sát (ví dụ: bao nhiêu người) có age lớn hơn 40 và literate? Khi bạn chạy

str(edu_equal_1)

Bạn sẽ thấy age là số nguyên, còn literate là một factor với các mức "yes" và "no". Vì vậy, biểu thức sau sẽ trả lời câu hỏi trên:

nrow(subset(edu_equal_1, age > 40 & literate == "yes"))

Giờ đến lượt bạn trả lời một câu hỏi tương tự:

Có bao nhiêu quan sát/cá nhân thuộc dân tộc Bulgarian có thu nhập trên 1000?

Hướng dẫn

50 XP

Các phương án trả lời