1. Learn
  2. /
  3. Cursuri
  4. /
  5. Programare funcțională intermediară cu purrr

Connected

exercițiu

Extragerea mențiunilor

În fiecare sublista a setului de date cu tweet-uri există un element numit "mentions_screen_name" (adică handle-uri de Twitter). Acest element conține fie NULL, dacă nu există nicio mențiune în tweet, fie unul sau mai multe nume de utilizator menționate. O modalitate de a identifica un cont popular dintr-o colecție de tweet-uri este să detectezi care utilizatori sunt menționați cel mai des.

Vom extrage mai întâi un vector cu toate mențiunile, iar odată obținut acest vector, vom număra de câte ori apare fiecare profil. Pentru asta, vom construi o nouă funcție compusă, combinând table() (care numără aparițiile fiecărui element din vector), sort() și tail().

purrr a fost încărcat pentru tine, iar rstudioconf este disponibil în setul tău de date.

Instrucțiuni

100 XP
  • Construiește o funcție care combină as_vector(), compact() și flatten().

  • Creează o funcție care primește două argumente: list și what. Această funcție va rula map( list, what ) și va transmite rezultatul către flatten_to_vector.

  • Creează six_most, o funcție care combină tail(), sort() și table().

  • Rulează extractor() pe rstudioconf și transmite rezultatul către six_most().