1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với dplyr

Connected

Bài tập

Trực quan hóa mức thay đổi phổ biến đã được chuẩn hóa

Bạn đã chọn vài tên và tính tần suất của mỗi tên như một phần của mức đỉnh của chính nó. Đây là một dạng “chuẩn hóa” tên, nơi bạn tập trung vào mức thay đổi tương đối trong từng tên thay vì độ phổ biến tổng thể của tên đó.

Trong bài tập này, bạn sẽ trực quan hóa độ phổ biến đã chuẩn hóa của từng tên. Kết quả từ bài trước, names_normalized, đã được cung cấp cho bạn.

names_normalized <- babynames %>%
                     group_by(name) %>%
                     mutate(name_total = sum(number),
                            name_max = max(number)) %>%
                     ungroup() %>%
                     mutate(fraction_max = number / name_max)

Hướng dẫn

100 XP
  • Lọc bảng names_normalized để chỉ giữ ba tên Steven, Thomas, và Matthew.
  • Tạo biểu đồ đường từ names_filtered để trực quan hóa fraction_max theo thời gian, tô màu theo name.