Aan de slagGa gratis aan de slag

Spelen met URL’s

In de vorige oefening hebben we het ruwe aantal tweets opgehaald die het patroon "github" bevatten. Tot nu toe is dit alleen een getal: 347, en je kunt nog niet bepalen welk aandeel van het totale aantal URL’s deze 347 vertegenwoordigt.

In deze oefening bouwen we een functie str_prop_detected(), die een tekenreeksvector en een patroon krijgt, en de proportie elementen teruggeeft die dit patroon bevatten. Deze functie kun je ook op andere gegevenssets gebruiken om het aandeel patroonovereenkomsten in een tekenreeksvector te bepalen.

Hier combineren we enkele purrr-functies met de functie str_detect() uit stringr. Deze twee packages zijn alvast voor je geladen, en de rstudioconf-gegevensset is nog steeds beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Gevorderd functioneel programmeren met purrr

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Complete the function definition
str_prop_detected <- function(string, pattern) {
  string %>%
    # Detect the pattern
    ___(___) %>%
    # Calculate the mean
    ___()
} 

# Create flatten_and_compact()
flatten_and_compact <- ___(___, ___)
Code bewerken en uitvoeren