Os resultados da amostra são generalizáveis?
Você acabou de ver como a amostragem por conveniência—coleta de dados usando o método mais fácil—pode resultar em amostras que não são representativas da população. De forma equivalente, isso significa que os resultados da amostra não são generalizáveis para a população. A visualização das distribuições da população e da amostra pode ajudar a determinar se a amostra é ou não representativa da população.
O conjunto de dados do Spotify contém uma coluna acousticness
, que é uma medida de confiança de zero a um para saber se a faixa foi feita com instrumentos acústicos. Você comparará a distribuição acousticness
da população total de músicas com uma amostra dessas músicas.
spotify_population
e spotify_mysterious_sample
estão disponíveis; pandas
como pd
, matplotlib.pyplot
como plt
, e numpy
como np
são carregados.
Este exercício faz parte do curso
Amostragem em Python
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Visualize the distribution of acousticness with a histogram
____
plt.show()