MulaiMulai sekarang secara gratis

Mengekstrak mention

Di setiap subdaftar pada himpunan data tweet, ada elemen bernama "mentions_screen_name" (yakni handle Twitter). Elemen ini berisi NULL jika tidak ada mention dalam tweet, atau satu maupun lebih nama layar yang disebutkan dalam tweet. Salah satu cara mendeteksi akun populer dari sekumpulan tweet adalah dengan mencari siapa pengguna yang paling sering disebut dalam koleksi tweet tertentu.

Kita akan terlebih dahulu mengekstrak sebuah vektor berisi semua mention, dan setelah mendapatkan vektor baru ini, kita akan menghitung berapa kali setiap profil disebut. Untuk melakukannya, kita akan membangun fungsi tersusun baru dengan mengombinasikan table() (yang menghitung jumlah kemunculan tiap elemen dalam vektor), sort(), dan tail().

purrr sudah dimuat untuk Anda, dan rstudioconf tersedia dalam himpunan data Anda.

Latihan ini adalah bagian dari kursus

Pemrograman Fungsional Tingkat Menengah dengan purrr

Lihat Kursus

Petunjuk latihan

  • Bangun sebuah fungsi yang merupakan kombinasi dari as_vector(), compact(), dan flatten().

  • Buat fungsi yang menerima dua argumen: list dan what. Fungsi ini akan menjalankan map( list, what ), lalu meneruskan hasilnya ke flatten_to_vector.

  • Buat six_most, sebuah fungsi yang mengombinasikan tail(), sort(), dan table().

  • Jalankan extractor() pada rstudioconf, lalu teruskan hasilnya ke six_most().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Combine as_vector(), compact(), and flatten()
flatten_to_vector <- ___(___, ___, ___)

# Complete the function
extractor <- function(list, what = "mentions_screen_name"){
  map( ___ , ___ ) %>%
    ___()
}

# Create six_most, with tail(), sort(), and table()
six_most <- ___(___, ___, ___)

# Run extractor() on rstudioconf
___(rstudioconf) %>% 
  ___()
Edit dan Jalankan Kode