1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Khám phá Dữ liệu với R

Connected

Bài tập

Tính các thước đo trung tâm

Xuyên suốt chương này, bạn sẽ dùng dữ liệu từ gapminder, bộ dữ liệu theo dõi các chỉ số nhân khẩu học của các quốc gia trên thế giới theo thời gian. Để tìm hiểu thêm, bạn có thể mở trang trợ giúp với ?gapminder.

Trong bài này, hãy tập trung vào cách tuổi thọ khác nhau giữa các châu lục. Điều này yêu cầu bạn phân tích không ở cấp độ quốc gia, mà tổng hợp lên cấp độ châu lục. Việc này được thực hiện nhờ “cú đấm một-hai” group_by() và summarize(), một cú pháp rất mạnh để thực hiện cùng một phân tích trên các tập con khác nhau của toàn bộ dữ liệu.

Hướng dẫn

100 XP
  • Tạo một tập dữ liệu tên gap2007 chỉ chứa dữ liệu của năm 2007.
  • Sử dụng gap2007, tính tuổi thọ trung bình (mean) và trung vị (median) cho từng châu lục. Chưa cần đặt tên cho các cột mới do summarize() tạo ra.
  • Xác nhận các xu hướng bạn thấy ở các giá trị trung vị bằng cách vẽ các biểu đồ hộp (box plot) đặt cạnh nhau về tuổi thọ cho từng châu lục.