Menemukan negara bagian berpendapatan terendah di tiap wilayah
Anda telah belajar menggabungkan beberapa verba dplyr. Di sini, Anda akan menggabungkan group_by(), summarize(), dan slice_min() untuk menemukan negara bagian di setiap wilayah dengan pendapatan tertinggi.
Saat Anda melakukan pengelompokan berdasarkan beberapa kolom lalu meringkas, penting untuk diingat bahwa summarize akan “mengupas” satu lapisan grup, tetapi sisanya tetap ada. Misalnya, jika Anda group_by(X, Y) lalu melakukan summarize, hasilnya masih akan dikelompokkan berdasarkan X.
counties_selected <- counties %>%
select(region, state, county, population, income)
Latihan ini adalah bagian dari kursus
Manipulasi Data dengan dplyr
Petunjuk latihan
- Hitung pendapatan rata-rata (sebagai
average_income) dari county dalam setiap wilayah dan negara bagian (perhatikan bahwagroup_by()sudah disediakan untuk Anda). - Temukan negara bagian dengan
average_incometerendah di setiap wilayah.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
counties_selected %>%
group_by(region, state) %>%
# Calculate average income
___
# Find the lowest income state in each region
___