Mengekstrak mention
Di setiap subdaftar pada himpunan data tweet, ada elemen bernama "mentions_screen_name" (yakni handle Twitter). Elemen ini berisi NULL jika tidak ada mention dalam tweet, atau satu maupun lebih nama layar yang disebutkan dalam tweet. Salah satu cara mendeteksi akun populer dari sekumpulan tweet adalah dengan mencari siapa pengguna yang paling sering disebut dalam koleksi tweet tertentu.
Kita akan terlebih dahulu mengekstrak sebuah vektor berisi semua mention, dan setelah mendapatkan vektor baru ini, kita akan menghitung berapa kali setiap profil disebut. Untuk melakukannya, kita akan membangun fungsi tersusun baru dengan mengombinasikan table() (yang menghitung jumlah kemunculan tiap elemen dalam vektor), sort(), dan tail().
purrr sudah dimuat untuk Anda, dan rstudioconf tersedia dalam himpunan data Anda.
Latihan ini adalah bagian dari kursus
Pemrograman Fungsional Tingkat Menengah dengan purrr
Petunjuk latihan
Bangun sebuah fungsi yang merupakan kombinasi dari
as_vector(),compact(), danflatten().Buat fungsi yang menerima dua argumen:
listdanwhat. Fungsi ini akan menjalankanmap( list, what ), lalu meneruskan hasilnya keflatten_to_vector.Buat
six_most, sebuah fungsi yang mengombinasikantail(),sort(), dantable().Jalankan
extractor()padarstudioconf, lalu teruskan hasilnya kesix_most().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Combine as_vector(), compact(), and flatten()
flatten_to_vector <- ___(___, ___, ___)
# Complete the function
extractor <- function(list, what = "mentions_screen_name"){
map( ___ , ___ ) %>%
___()
}
# Create six_most, with tail(), sort(), and table()
six_most <- ___(___, ___, ___)
# Run extractor() on rstudioconf
___(rstudioconf) %>%
___()