Os resultados da amostra são generalizáveis?
Você acabou de ver como a amostragem por conveniência—coleta de dados usando o método mais fácil—pode resultar em amostras que não são representativas da população. De forma equivalente, isso significa que os resultados da amostra não são generalizáveis para a população. A visualização das distribuições da população e da amostra pode ajudar a determinar se a amostra é ou não representativa da população.
O conjunto de dados do Spotify contém uma coluna acousticness, que é uma medida de confiança de zero a um para saber se a faixa foi feita com instrumentos acústicos. Você comparará a distribuição acousticness da população total de músicas com uma amostra dessas músicas.
spotify_population e spotify_mysterious_sample estão disponíveis; pandas como pd, matplotlib.pyplot como plt, e numpy como np são carregados.
Este exercício faz parte do curso
Amostragem em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Visualize the distribution of acousticness with a histogram
____
plt.show()