MulaiMulai sekarang secara gratis

Menelaah jumlah level

dplyr memiliki dua fungsi lain yang berguna saat mengeksplorasi himpunan data. Pertama adalah slice_max(var, n = x), yang mengambil x baris teratas dari sebuah himpunan data berdasarkan nilai var. Fungsi lainnya adalah pull(), yang memungkinkan Anda mengekstrak sebuah kolom dan menghapus namanya, sehingga hanya menyisakan nilai dari kolom tersebut.

Sebagai contoh, jika Anda ingin mengambil, sebagai sekumpulan nilai, dua nilai mpg teratas dari himpunan data klasik mtcars, Anda dapat menulis:

mtcars %>%
  slice_max(mpg, n = 2) %>%
  pull(mpg)

Ini menghasilkan:

[1] 32.4 33.9

Latihan ini adalah bagian dari kursus

Data Kategorikal di Tidyverse

Lihat Kursus

Petunjuk latihan

  • Gunakan slice_max() untuk mencetak 3 baris dengan jumlah level faktor tertinggi.
  • Dengan memfilter variabel CurrentJobTitleSelect, lakukan pull terhadap jumlah level yang dimilikinya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Select the 3 rows with the highest number of levels
number_of_levels %>%
    ___(num_levels, n = 3)
    
number_of_levels %>%
	# Filter for where the column called variable equals CurrentJobTitleSelect
    filter(___) %>%
	# Pull num_levels
    ___
Edit dan Jalankan Kode