Trực quan hóa mức thay đổi phổ biến đã được chuẩn hóa

Bạn đã chọn vài tên và tính tần suất của mỗi tên như một phần của mức đỉnh của chính nó. Đây là một dạng “chuẩn hóa” tên, nơi bạn tập trung vào mức thay đổi tương đối trong từng tên thay vì độ phổ biến tổng thể của tên đó.

Trong bài tập này, bạn sẽ trực quan hóa độ phổ biến đã chuẩn hóa của từng tên. Kết quả từ bài trước, names_normalized, đã được cung cấp cho bạn.

names_normalized <- babynames %>%
                     group_by(name) %>%
                     mutate(name_total = sum(number),
                            name_max = max(number)) %>%
                     ungroup() %>%
                     mutate(fraction_max = number / name_max)

Bài tập này là một phần của khóa học

Xử lý dữ liệu với dplyr

Xem khóa học

Hướng dẫn bài tập

Lọc bảng names_normalized để chỉ giữ ba tên Steven, Thomas, và Matthew.
Tạo biểu đồ đường từ names_filtered để trực quan hóa fraction_max theo thời gian, tô màu theo name.

Bài tập tương tác thực hành trực tiếp

Hãy thử làm bài tập này bằng cách hoàn thành đoạn mã mẫu này.

names_filtered <- names_normalized %>%
  # Filter for the names Steven, Thomas, and Matthew
  ___

# Visualize the names in names_filtered over time
___

Chỉnh sửa và Chạy Mã

Bài tập này là một phần của khóa học

Xử lý dữ liệu với dplyr

SkillTag.level.beginnerSkillTag.label

4.8+

Bắt đầu khóa học miễn phí

Học các động từ dùng để biến đổi dữ liệu của bạn, bao gồm select, filter, arrange và mutate. Bạn sẽ dùng các hàm này để chỉnh sửa bộ dữ liệu counties nhằm xem những quan sát cụ thể và trả lời các câu hỏi về dữ liệu.

Exercise 1: Khám phá dữ liệu với dplyr Exercise 2: Hiểu dữ liệu của bạn Exercise 3: Chọn cột Exercise 4: Động từ filter và arrange Exercise 5: Sắp xếp các quan sát Exercise 6: Lọc theo điều kiện Exercise 7: Lọc và sắp xếp Exercise 8: Động từ mutate()Exercise 9: Tính số nhân viên làm việc cho chính phủ Exercise 10: Tính tỷ lệ phụ nữ trong một hạt (county)Exercise 11: Mutate, filter, và arrange

Giờ bạn đã biết cách biến đổi dữ liệu, bạn sẽ muốn biết thêm cách tổng hợp dữ liệu để dễ diễn giải hơn. Bạn sẽ học nhiều hàm có thể dùng để gom nhiều quan sát trong dữ liệu và tóm tắt chúng, bao gồm count, group_by, summarize, ungroup, và slice_min/slice_max.

Exercise 1: Động từ count Exercise 2: Đếm theo vùng Exercise 3: Đếm số công dân theo bang Exercise 4: Biến đổi và đếm Exercise 5: Các động từ group_by, summarize và ungroup Exercise 6: Tóm tắt dữ liệu Exercise 7: Tóm tắt theo bang Exercise 8: Tóm tắt theo bang và vùng Exercise 9: Động từ slice_min và slice_max Exercise 10: Chọn một hạt từ mỗi vùng Exercise 11: Tìm bang có thu nhập thấp nhất ở mỗi vùng Exercise 12: Kết hợp summarize, slice_max và count

Học các phương pháp nâng cao để chọn và biến đổi cột. Đồng thời, tìm hiểu về các select helper, là các hàm chỉ định tiêu chí cho những cột bạn muốn chọn, cũng như động từ rename.

Exercise 1: Chọn cột Exercise 2: Chọn cột Exercise 3: Select helpers Exercise 4: Động từ rename Exercise 5: Đổi tên cột sau khi count Exercise 6: Đổi tên cột trong khi select Exercise 7: Động từ relocate Exercise 8: Sử dụng relocate Exercise 9: Chọn giữa bốn động từ

Làm việc với một bộ dữ liệu mới ghi nhận tên trẻ sơ sinh ở Hoa Kỳ qua từng năm. Học cách dùng grouped mutate và window functions để đặt và trả lời những câu hỏi phức tạp hơn về dữ liệu của bạn. Và kết hợp dplyr với ggplot2 để tạo các biểu đồ thú vị nhằm khám phá dữ liệu sâu hơn.

Exercise 1: Dữ liệu babynames Exercise 2: Lọc và sắp xếp cho một năm Exercise 3: Tìm các tên phổ biến nhất theo từng năm Exercise 4: Trực quan hóa tên với ggplot2 Exercise 5: Biến đổi theo nhóm Exercise 6: Tìm năm mà mỗi tên phổ biến nhất Exercise 7: Thêm tổng và giá trị lớn nhất cho mỗi tên Exercise 8: Trực quan hóa mức thay đổi phổ biến đã được chuẩn hóa

Bài tập hiện tại

Exercise 9: Hàm cửa sổ Exercise 10: Dùng tỷ lệ để mô tả tần suất của một tên Exercise 11: Những cú nhảy lớn nhất của một cái tên Exercise 12: Chúc mừng bạn!