1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dữ liệu phân loại trong Tidyverse

Connected

Bài tập

Tóm tắt dữ liệu

Giờ hãy tạo một biểu đồ phân mảnh (faceted) để so sánh mức độ hữu ích giữa các nền tảng học tập.

Trong bài này, bạn sẽ gặp một hàm mới của dplyr, add_count(). add_count() sẽ thêm một cột n vào dữ liệu, giữ nguyên số dòng như ban đầu. Tương tự count(), mặc định n là số dòng trong mỗi nhóm, nhưng bạn có thể thay đổi với đối số wt (weight). Khi đặt wt bằng một cột khác, n sẽ bằng tổng của cột đó theo từng nhóm.

Giả sử bạn muốn thêm vào iris một cột là tổng Petal.Length của tất cả các bông hoa cùng Species. Bạn sẽ viết:

iris %>%
   add_count(Species, wt = Petal.Length) %>%
   select(Species, Petal.Length, n)

Kết quả trả về sẽ là:

# A tibble: 150 x 3
   Species Petal.Length     n
   <fct>          <dbl> <dbl>
 1 setosa           1.4  73.1
 2 setosa           1.4  73.1
 3 virginica        6.4  278.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Dùng count() để chuyển dữ liệu thành một dòng cho mỗi cặp learning_platform và usefulness, với một cột là số bản ghi có cặp đó.