MulaiMulai sekarang secara gratis

Kita punya pemenang!

Dalam latihan ini, kita akan mengidentifikasi metrik penting — siapa pengguna yang menerbitkan tweet dengan jumlah retweet terbanyak?

Informasi seperti ini penting saat Anda melakukan analisis media sosial: ini akan memberi tahu Anda tentang tweet paling "terkenal" dalam himpunan data Anda. Ini dapat membantu, di masa mendatang, untuk menetapkan tema dan pengguna kunci untuk suatu topik/hashtag tertentu.

Kita akan menggunakan purrr untuk mengekstrak tweet yang paling banyak diretweet dari korpus kita, dan melihat siapa pengguna di balik tweet tersebut. Karena kita ingin analisis ini dijalankan hanya pada tweet asli, kami telah menyediakan list non_rt, yang dibuat pada latihan sebelumnya.

Latihan ini adalah bagian dari kursus

Pemrograman Fungsional Tingkat Menengah dengan purrr

Lihat Kursus

Petunjuk latihan

  • Ekstrak semua elemen "retweet_count" dengan varian map_*() yang sesuai. Teruskan ke max().

  • Isikan terlebih dahulu sebuah map_at(), dengan .at adalah "retweet_count" dan .f adalah sebuah mapper yang menguji kesetaraan terhadap max_rt.

  • Peta fungsi baru ini pada non_rt, simpan hanya "retweet_count", dan ratakan hasilnya.

  • Cetak $screen_name dan $text dari hasil tersebut ke konsol.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Get the max() of "retweet_count" 
max_rt <- ___(non_rt, ___) %>% 
  ___()

# Prefill map_at() with a mapper testing if .x equal max_rt
max_rt_calc <- ___(___, .at = "retweet_count", .f := ~ ___ )

res <- non_rt %>%
  # Call max_rt_calc() on each element
  ___(___) %>% 
  # Keep elements where retweet_count is non-zero
  ___("___") %>% 
  # Flatten it
  ___()

# Print the "screen_name" and "text" of the result
res$screen_name
res$text
Edit dan Jalankan Kode