Aan de slagGa gratis aan de slag

Eenvoudig steekproeven nemen met dplyr

In dit hoofdstuk ga je songgegevens van Spotify verkennen. Elke rij in de gegevensset stelt een nummer voor, en er zijn 41656 rijen. Kolommen bevatten de naam van het nummer, de artiesten die het uitvoeren, het uitbrengjaar en kenmerken van het nummer zoals de duur, het tempo en de dansbaarheid. We beginnen met de duraties.

Je eerste taak is om een steekproef te nemen uit de songgegevens en een berekening op de hele populatie te vergelijken met dezelfde berekening op een steekproef.

spotify_population is beschikbaar en dplyr is geladen.

Deze oefening maakt deel uit van de cursus

Steekproeven in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# View the whole population dataset
___

# Sample 1000 rows from spotify_population
spotify_sample <- ___


# See the result
spotify_sample
Code bewerken en uitvoeren