1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê với R

Connected

Bài tập

So sánh các nhóm

Trong bài tập này, bạn sẽ so sánh phân phối dữ liệu giữa các nhóm.

Bộ dữ liệu PlantGrowth từ gói datasets chứa kết quả từ một thí nghiệm về năng suất. Bộ dữ liệu có hai biến:

  • group - cho biết kết quả thuộc nhóm đối chứng hay một trong hai nhóm điều trị,
  • weight - khối lượng khô của cây dùng để đo năng suất.

Hãy nhớ rằng tapply() có thể được dùng để tính toán các chỉ số theo nhóm.

Ví dụ,

tapply(df$x, df$grp, FUN = median)

trả về trung vị của x theo grp từ khung dữ liệu df.

Nhiệm vụ của bạn là tính trung bình và trực quan hóa năm thống kê thường dùng của khối lượng năng suất. Biểu đồ sẽ giúp bạn so sánh sự khác biệt của biến phản hồi giữa các nhóm.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tính trung bình weight cho nhóm đối chứng và hai nhóm điều trị. Sử dụng bộ dữ liệu PlantGrowth.
  • Trực quan hóa năm thống kê thường dùng (giá trị nhỏ nhất, tứ phân vị thứ nhất, trung vị, tứ phân vị thứ ba và giá trị lớn nhất) của weight theo nhóm.