1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với dplyr

Connected

Bài tập

Thêm tổng và giá trị lớn nhất cho mỗi tên

Trong video, bạn đã học cách nhóm theo năm và dùng mutate() để thêm tổng của năm đó.

Trong các bài tập này, bạn sẽ chuẩn hóa theo một thước đo khác cũng thú vị: bạn sẽ chia mỗi tên cho giá trị lớn nhất của chính tên đó. Điều này có nghĩa là mỗi tên sẽ đạt đỉnh tại 1.

Sau khi thêm các cột mới, kết quả vẫn sẽ được nhóm theo tên. Việc này chia dữ liệu thành 48.000 nhóm, và thực tế sẽ làm chậm các bước sau như mutate.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Dùng grouped mutate để thêm hai cột:
    • name_total: tổng số trẻ sinh ra mang tên đó trong toàn bộ tập dữ liệu.
    • name_max: số trẻ lớn nhất mang tên đó trong bất kỳ năm nào.