Mentions extraheren
In elke sublijst van de gegevensset met tweets staat een element "mentions_screen_name" (oftewel Twitter-handles). Dit element bevat NULL als er geen mention in de tweet stond, of één of meer schermnamen die in de tweet zijn genoemd. Een manier om een populair account te vinden in een lijst met tweets is te tellen welke gebruikers het vaakst worden genoemd in een specifieke tweetverzameling.
We halen eerst een vector met alle mentions op. Zodra we die vector hebben, tellen we hoe vaak elk profiel genoemd wordt. Daarvoor bouwen we een nieuwe samengestelde functie door table() (die het aantal keer dat elk element in de vector voorkomt telt), sort() en tail() te combineren.
purrr is al voor je geladen en rstudioconf is beschikbaar in je gegevensset.
Deze oefening maakt deel uit van de cursus
Gevorderd functioneel programmeren met purrr
Oefeninstructies
Bouw een functie die
as_vector(),compact()enflatten()combineert.Maak een functie die twee argumenten aanneemt:
listenwhat. Deze functie voertmap( list, what )uit en geeft het resultaat door aanflatten_to_vector.Maak
six_most, een functie dietail(),sort()entable()combineert.Voer
extractor()uit oprstudioconfen geef het resultaat door aansix_most().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Combine as_vector(), compact(), and flatten()
flatten_to_vector <- ___(___, ___, ___)
# Complete the function
extractor <- function(list, what = "mentions_screen_name"){
map( ___ , ___ ) %>%
___()
}
# Create six_most, with tail(), sort(), and table()
six_most <- ___(___, ___, ___)
# Run extractor() on rstudioconf
___(rstudioconf) %>%
___()