Zijn deze bevindingen te veralgemenen?
Laten we naar een andere steekproef kijken om te zien of die representatief is voor de populatie. Deze keer kijk je naar de kolom duration_minutes in de Spotify-gegevensset, die de lengte van het nummer in minuten bevat.
spotify_population en spotify_mysterious_sample2 zijn beschikbaar; pandas, matplotlib.pyplot en numpy zijn geladen met hun gebruikelijke aliassen.
Deze oefening maakt deel uit van de cursus
Steekproeven in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize the distribution of duration_minutes as a histogram
spotify_population['duration_minutes'].hist(____)
plt.show()