Aan de slagGa gratis aan de slag

Mentions extraheren

In elke sublijst van de gegevensset met tweets staat een element "mentions_screen_name" (oftewel Twitter-handles). Dit element bevat NULL als er geen mention in de tweet stond, of één of meer schermnamen die in de tweet zijn genoemd. Een manier om een populair account te vinden in een lijst met tweets is te tellen welke gebruikers het vaakst worden genoemd in een specifieke tweetverzameling.

We halen eerst een vector met alle mentions op. Zodra we die vector hebben, tellen we hoe vaak elk profiel genoemd wordt. Daarvoor bouwen we een nieuwe samengestelde functie door table() (die het aantal keer dat elk element in de vector voorkomt telt), sort() en tail() te combineren.

purrr is al voor je geladen en rstudioconf is beschikbaar in je gegevensset.

Deze oefening maakt deel uit van de cursus

Gevorderd functioneel programmeren met purrr

Cursus bekijken

Oefeninstructies

  • Bouw een functie die as_vector(), compact() en flatten() combineert.

  • Maak een functie die twee argumenten aanneemt: list en what. Deze functie voert map( list, what ) uit en geeft het resultaat door aan flatten_to_vector.

  • Maak six_most, een functie die tail(), sort() en table() combineert.

  • Voer extractor() uit op rstudioconf en geef het resultaat door aan six_most().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Combine as_vector(), compact(), and flatten()
flatten_to_vector <- ___(___, ___, ___)

# Complete the function
extractor <- function(list, what = "mentions_screen_name"){
  map( ___ , ___ ) %>%
    ___()
}

# Create six_most, with tail(), sort(), and table()
six_most <- ___(___, ___, ___)

# Run extractor() on rstudioconf
___(rstudioconf) %>% 
  ___()
Code bewerken en uitvoeren