Lonjakan terbesar dalam sebuah nama
Sebelumnya, Anda menambahkan kolom ratio untuk menggambarkan rasio frekuensi sebuah nama bayi antara tahun-tahun berurutan guna menjelaskan perubahan popularitas sebuah nama. Kini, Anda akan melihat subset dari data tersebut, bernama babynames_ratios_filtered, untuk menelusuri lebih jauh nama-nama yang mengalami lonjakan popularitas terbesar pada tahun-tahun berurutan.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Latihan ini adalah bagian dari kursus
Manipulasi Data dengan dplyr
Petunjuk latihan
- Dari setiap nama dalam data, pertahankan observasi (tahunnya) dengan
ratioterbesar; perhatikan bahwa data sudah dikelompokkan berdasarkanname. - Urutkan kolom
ratiosecara menurun. - Saring data
babynames_ratios_filteredlebih lanjut dengan memfilter kolomfractionagar hanya menampilkan hasil yang lebih besar atau sama dengan0.001.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___