1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dữ liệu phân loại trong Tidyverse

Connected

Bài tập

Khám phá số lượng mức

dplyr có hai hàm khác có thể hữu ích khi bạn khám phá một bộ dữ liệu. Đầu tiên là slice_max(var, n = x), hàm này lấy x hàng đầu tiên của bộ dữ liệu dựa trên giá trị của var. Hàm còn lại là pull(), cho phép bạn trích xuất một cột và bỏ tên cột, chỉ giữ lại các giá trị.

Ví dụ, nếu bạn muốn lấy (dưới dạng một tập giá trị) hai giá trị mpg cao nhất từ bộ dữ liệu kinh điển mtcars, bạn sẽ viết:

mtcars %>%
  slice_max(mpg, n = 2) %>%
  pull(mpg)

Kết quả sẽ là:

[1] 32.4 33.9

Hướng dẫn

100 XP
  • Dùng slice_max() để in ra 3 hàng có số lượng mức của factor cao nhất.
  • Lọc theo biến CurrentJobTitleSelect, dùng pull để lấy số lượng mức của biến này.