Menelaah jumlah level
dplyr memiliki dua fungsi lain yang berguna saat mengeksplorasi himpunan data. Pertama adalah slice_max(var, n = x), yang mengambil x baris teratas dari sebuah himpunan data berdasarkan nilai var. Fungsi lainnya adalah pull(), yang memungkinkan Anda mengekstrak sebuah kolom dan menghapus namanya, sehingga hanya menyisakan nilai dari kolom tersebut.
Sebagai contoh, jika Anda ingin mengambil, sebagai sekumpulan nilai, dua nilai mpg teratas dari himpunan data klasik mtcars, Anda dapat menulis:
mtcars %>%
slice_max(mpg, n = 2) %>%
pull(mpg)
Ini menghasilkan:
[1] 32.4 33.9
Latihan ini merupakan bagian dari kursus
Data Kategorikal di Tidyverse
Instruksi latihan
- Gunakan
slice_max()untuk mencetak 3 baris dengan jumlah level faktor tertinggi. - Dengan memfilter variabel
CurrentJobTitleSelect, lakukanpullterhadap jumlah level yang dimilikinya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Select the 3 rows with the highest number of levels
number_of_levels %>%
___(num_levels, n = 3)
number_of_levels %>%
# Filter for where the column called variable equals CurrentJobTitleSelect
filter(___) %>%
# Pull num_levels
___