1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Funkcyjne programowanie średnio zaawansowane z purrr

Connected

Exercise

Wyodrębnianie wzmianek

W każdej podliście zbioru danych z tweetami znajduje się element o nazwie "mentions_screen_name" (czyli nazwy użytkowników na Twitterze). Element ten zawiera albo NULL, jeśli w tweecie nie było żadnej wzmianki, albo jedną lub więcej nazw wspomnianych użytkowników. Aby wykryć popularne konta na podstawie listy tweetów, można sprawdzić, którzy użytkownicy są najczęściej wymieniani w danej kolekcji.

Na początek wyodrębnimy wektor wszystkich wzmianek, a następnie policzymy, ile razy każdy profil został wspomniany. W tym celu zbudujemy nową złożoną funkcję, łącząc table() (która zlicza wystąpienia każdego elementu w wektorze), sort() i tail().

Biblioteka purrr jest już załadowana, a zbiór danych rstudioconf jest dostępny w środowisku.

Instrukcje

100 XP
  • Zbuduj funkcję będącą kombinacją as_vector(), compact() i flatten().

  • Utwórz funkcję przyjmującą dwa argumenty: list i what. Funkcja ta uruchomi map( list, what ) i przekaże wynik do flatten_to_vector.

  • Utwórz six_most – funkcję łączącą tail(), sort() i table().

  • Uruchom extractor() na zbiorze rstudioconf i przekaż wynik do six_most().