Kita punya pemenang!
Dalam latihan ini, kita akan mengidentifikasi metrik penting — siapa pengguna yang menerbitkan tweet dengan jumlah retweet terbanyak?
Informasi seperti ini penting saat Anda melakukan analisis media sosial: ini akan memberi tahu Anda tentang tweet paling "terkenal" dalam himpunan data Anda. Ini dapat membantu, di masa mendatang, untuk menetapkan tema dan pengguna kunci untuk suatu topik/hashtag tertentu.
Kita akan menggunakan purrr untuk mengekstrak tweet yang paling banyak diretweet dari korpus kita, dan melihat siapa pengguna di balik tweet tersebut. Karena kita ingin analisis ini dijalankan hanya pada tweet asli, kami telah menyediakan list non_rt, yang dibuat pada latihan sebelumnya.
Latihan ini adalah bagian dari kursus
Pemrograman Fungsional Tingkat Menengah dengan purrr
Petunjuk latihan
Ekstrak semua elemen
"retweet_count"dengan varianmap_*()yang sesuai. Teruskan kemax().Isikan terlebih dahulu sebuah
map_at(), dengan.atadalah"retweet_count"dan.fadalah sebuah mapper yang menguji kesetaraan terhadapmax_rt.Peta fungsi baru ini pada
non_rt, simpan hanya"retweet_count", dan ratakan hasilnya.Cetak
$screen_namedan$textdari hasil tersebut ke konsol.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the max() of "retweet_count"
max_rt <- ___(non_rt, ___) %>%
___()
# Prefill map_at() with a mapper testing if .x equal max_rt
max_rt_calc <- ___(___, .at = "retweet_count", .f := ~ ___ )
res <- non_rt %>%
# Call max_rt_calc() on each element
___(___) %>%
# Keep elements where retweet_count is non-zero
___("___") %>%
# Flatten it
___()
# Print the "screen_name" and "text" of the result
res$screen_name
res$text