Eenvoudig steekproeven nemen met dplyr
In dit hoofdstuk ga je songgegevens van Spotify verkennen. Elke rij in de gegevensset stelt een nummer voor, en er zijn 41656 rijen. Kolommen bevatten de naam van het nummer, de artiesten die het uitvoeren, het uitbrengjaar en kenmerken van het nummer zoals de duur, het tempo en de dansbaarheid. We beginnen met de duraties.
Je eerste taak is om een steekproef te nemen uit de songgegevens en een berekening op de hele populatie te vergelijken met dezelfde berekening op een steekproef.
spotify_population is beschikbaar en dplyr is geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# View the whole population dataset
___
# Sample 1000 rows from spotify_population
spotify_sample <- ___
# See the result
spotify_sample