Zijn bevindingen uit de steekproef te veralgemeniseren?
Je hebt net gezien hoe gemakzuchtig steekproeven nemen—data verzamelen op de makkelijkste manier—kan leiden tot steekproeven die niet representatief zijn voor de populatie. Met andere woorden: bevindingen uit de steekproef zijn niet te veralgemeniseren naar de populatie. Het visualiseren van de verdelingen van de populatie en de steekproef kan helpen bepalen of de steekproef representatief is voor de populatie.
De Spotify-gegevensset bevat een kolom acousticness, een betrouwbaarheidsmaat van nul tot één voor de vraag of een track is gemaakt met instrumenten die niet zijn ingeplugd. Je gaat de acousticness-verdeling van de volledige populatie van nummers vergelijken met een steekproef van die nummers.
spotify_population en spotify_mysterious_sample zijn beschikbaar; pandas als pd, matplotlib.pyplot als plt en numpy als np zijn geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize the distribution of acousticness with a histogram
____
plt.show()