Menelaah jumlah level
dplyr memiliki dua fungsi lain yang berguna saat mengeksplorasi himpunan data. Pertama adalah slice_max(var, n = x), yang mengambil x baris teratas dari sebuah himpunan data berdasarkan nilai var. Fungsi lainnya adalah pull(), yang memungkinkan Anda mengekstrak sebuah kolom dan menghapus namanya, sehingga hanya menyisakan nilai dari kolom tersebut.
Sebagai contoh, jika Anda ingin mengambil, sebagai sekumpulan nilai, dua nilai mpg teratas dari himpunan data klasik mtcars, Anda dapat menulis:
mtcars %>%
slice_max(mpg, n = 2) %>%
pull(mpg)
Ini menghasilkan:
[1] 32.4 33.9
Latihan ini adalah bagian dari kursus
Data Kategorikal di Tidyverse
Petunjuk latihan
- Gunakan
slice_max()untuk mencetak 3 baris dengan jumlah level faktor tertinggi. - Dengan memfilter variabel
CurrentJobTitleSelect, lakukanpullterhadap jumlah level yang dimilikinya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select the 3 rows with the highest number of levels
number_of_levels %>%
___(num_levels, n = 3)
number_of_levels %>%
# Filter for where the column called variable equals CurrentJobTitleSelect
filter(___) %>%
# Pull num_levels
___