As conclusões do conjunto amostral são generalizáveis?
Você acabou de ver como a amostragem por conveniência — coletar dados pelo método mais fácil — pode resultar em amostras que não representam toda a população. Em outras palavras, isso significa que as conclusões da amostra não são generalizáveis para toda a população. Visualizar as distribuições da população e da amostra pode ajudar a determinar se a amostra é ou não representativa da população.
O conjunto de dados do Spotify contém uma coluna chamada acousticness, que é uma medida de confiança, de zero a um, indicando se a faixa é acústica, ou seja, se foi feita com instrumentos que não são plugados. Aqui, você vai observar a acousticness na população total de músicas e em uma amostra dessas músicas.
spotify_population e spotify_mysterious_sample estão disponíveis; dplyr e ggplot2 já estão carregados.
Este exercício faz parte do curso
Amostragem em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Visualize the distribution of acousticness as a histogram with a binwidth of 0.01
___