Distribuição de amostragem vs. distribuição de bootstrap
A distribuição de amostragem e a distribuição de bootstrap estão intimamente ligadas. Em situações em que você pode tirar amostras repetidas de uma população (essas ocasiões são raras), é útil gerar a distribuição de amostragem e a distribuição de bootstrap, uma após a outra, para ver como elas estão relacionadas.
Aqui, a estatística na qual você está interessado é a pontuação média de popularity
das músicas.
spotify_population
(todo o conjunto de dados) e spotify_sample
(500
linhas amostradas aleatoriamente de spotify_population
) estão disponíveis; pandas
e numpy
estão carregados com seus nomes alternativos habituais.
Este exercício faz parte do curso
Amostragem em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
mean_popularity_2000_samp = []
# Generate a sampling distribution of 2000 replicates
____:
mean_popularity_2000_samp.append(
# Sample 500 rows and calculate the mean popularity
____
)
# Print the sampling distribution results
print(mean_popularity_2000_samp)