Médias da população e da distribuição amostral
Uma das vantagens das distribuições amostrais é que você pode quantificá-las. Em especial, é possível calcular estatísticas-resumo sobre elas. Aqui, vamos observar a relação entre a média da distribuição amostral e o parâmetro populacional que a amostragem deve estimar.
Três distribuições amostrais são fornecidas. Em cada caso, o conjunto de dados de desligamento de funcionários foi amostrado usando amostragem aleatória simples, e então a média de desligamento foi calculada. Isso foi feito 1000 vezes para obter uma distribuição amostral das médias de desligamento. Uma distribuição amostral usou tamanho de amostra 5 em cada repetição, outra usou 50 e outra usou 500.
attrition_pop, sampling_distribution_5, sampling_distribution_50 e sampling_distribution_500 estão disponíveis; dplyr está carregado.
Este exercício faz parte do curso
Amostragem em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the mean across replicates of the mean attritions in sampling_distribution_5
mean_of_means_5 <- sampling_distribution_5 %>%
___
# Do the same for sampling_distribution_50
mean_of_means_50 <- ___
# ... and for sampling_distribution_500
mean_of_means_500 <- ___
# See the results
mean_of_means_5
mean_of_means_50
mean_of_means_500