ComeçarComece de graça

Distribuição de amostragem vs. distribuição de bootstrap

A distribuição de amostragem e a distribuição de bootstrap estão intimamente ligadas. Em situações em que você pode tirar amostras repetidas de uma população (essas ocasiões são raras), é útil gerar a distribuição de amostragem e a distribuição de bootstrap, uma após a outra, para ver como elas estão relacionadas.

Aqui, a estatística na qual você está interessado é a pontuação média de popularity das músicas.

spotify_population (todo o conjunto de dados) e spotify_sample (500 linhas amostradas aleatoriamente de spotify_population) estão disponíveis; pandas e numpy estão carregados com seus nomes alternativos habituais.

Este exercício faz parte do curso

Amostragem em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

mean_popularity_2000_samp = []

# Generate a sampling distribution of 2000 replicates
____:
    mean_popularity_2000_samp.append(
    	# Sample 500 rows and calculate the mean popularity 
    	____
    )

# Print the sampling distribution results
print(mean_popularity_2000_samp)
Editar e executar o código