Seviye sayısını inceleme
dplyr, bir veri kümesini keşfederken işe yarayabilecek iki başka işleve sahiptir. İlki, slice_max(var, n = x); bu, var değerine göre veri kümesinin ilk x satırını getirir. Diğeri ise pull(); bu da bir sütunu çıkarıp adını atarak yalnızca sütundaki değer(ler)i almamızı sağlar.
Örneğin, klasik mtcars veri kümesinden, bir değer kümesi olarak en yüksek iki mpg değerini almak isteseydik, şöyle yazardık:
mtcars %>%
slice_max(mpg, n = 2) %>%
pull(mpg)
Bu bize şunu verir:
[1] 32.4 33.9
Bu egzersiz
Tidyverse'te Kategorik Veriler
kursunun bir parçasıdırEgzersiz talimatları
- En yüksek faktör seviye sayısına sahip 3 satırı yazdırmak için
slice_max()kullan. CurrentJobTitleSelectdeğişkeni için filtreleme yaparak, sahip olduğu seviye sayısınıpullile al.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Select the 3 rows with the highest number of levels
number_of_levels %>%
___(num_levels, n = 3)
number_of_levels %>%
# Filter for where the column called variable equals CurrentJobTitleSelect
filter(___) %>%
# Pull num_levels
___