Spelen met URL’s
In de vorige oefening hebben we het ruwe aantal tweets opgehaald die het patroon "github" bevatten. Tot nu toe is dit alleen een getal: 347, en je kunt nog niet bepalen welk aandeel van het totale aantal URL’s deze 347 vertegenwoordigt.
In deze oefening bouwen we een functie str_prop_detected(), die een tekenreeksvector en een patroon krijgt, en de proportie elementen teruggeeft die dit patroon bevatten. Deze functie kun je ook op andere gegevenssets gebruiken om het aandeel patroonovereenkomsten in een tekenreeksvector te bepalen.
Hier combineren we enkele purrr-functies met de functie str_detect() uit stringr. Deze twee packages zijn alvast voor je geladen, en de rstudioconf-gegevensset is nog steeds beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Gevorderd functioneel programmeren met purrr
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Complete the function definition
str_prop_detected <- function(string, pattern) {
string %>%
# Detect the pattern
___(___) %>%
# Calculate the mean
___()
}
# Create flatten_and_compact()
flatten_and_compact <- ___(___, ___)