Apakah temuan dari sampel dapat digeneralisasi?
Anda baru saja melihat bagaimana convenience sampling—mengumpulkan data dengan cara termudah—dapat menghasilkan sampel yang tidak mewakili populasi. Artinya, temuan dari sampel tidak dapat digeneralisasi ke populasi. Memvisualisasikan distribusi populasi dan sampel dapat membantu menentukan apakah sampel mewakili populasi atau tidak.
Himpunan data Spotify memiliki kolom acousticness, yaitu ukuran keyakinan dari nol sampai satu tentang apakah suatu lagu dibuat dengan instrumen yang tidak dicolokkan. Anda akan membandingkan distribusi acousticness dari keseluruhan populasi lagu dengan sebuah sampel lagu.
spotify_population dan spotify_mysterious_sample tersedia; pandas sebagai pd, matplotlib.pyplot sebagai plt, dan numpy sebagai np sudah dimuat.
Latihan ini merupakan bagian dari kursus
Sampling di Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Visualize the distribution of acousticness with a histogram
____
plt.show()