Distribuição amostral vs. distribuição bootstrap
A distribuição amostral e a distribuição bootstrap estão intimamente relacionadas. Em situações em que você pode amostrar repetidamente de uma população (isso é raro) e, à medida que aprende sobre ambas, é útil gerar primeiro a distribuição amostral e depois a distribuição bootstrap, uma após a outra, para ver como elas se relacionam.
Aqui, a estatística de interesse é a média do score de popularity das músicas.
spotify_population (o conjunto de dados completo) e spotify_sample (apenas 500 linhas representando uma amostra original) estão disponíveis; dplyr está carregado.
Este exercício faz parte do curso
Amostragem em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
# Use 2000 replicates
___,
expr = {
# Start with the population
___ %>%
# Sample 500 rows without replacement
___ %>%
# Calculate the mean popularity as mean_popularity
___ %>%
# Pull out the mean popularity
___
}
)
# See the result
mean_popularity_2000_samp