Distribuição amostral vs. distribuição bootstrap

A distribuição amostral e a distribuição bootstrap estão intimamente relacionadas. Em situações em que você pode amostrar repetidamente de uma população (isso é raro) e, à medida que aprende sobre ambas, é útil gerar primeiro a distribuição amostral e depois a distribuição bootstrap, uma após a outra, para ver como elas se relacionam.

Aqui, a estatística de interesse é a média do score de popularity das músicas.

spotify_population (o conjunto de dados completo) e spotify_sample (apenas 500 linhas representando uma amostra original) estão disponíveis; dplyr está carregado.

Este exercicio faz parte do curso

Amostragem em R

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
  # Use 2000 replicates
  ___,
  expr = {
    # Start with the population
    ___ %>% 
      # Sample 500 rows without replacement
      ___ %>% 
      # Calculate the mean popularity as mean_popularity
      ___ %>% 
      # Pull out the mean popularity
      ___
  }
)

# See the result
mean_popularity_2000_samp

Editar e Executar Código