Comece agoraComece grátis

Distribuição de amostragem vs. distribuição de bootstrap

A distribuição de amostragem e a distribuição de bootstrap estão intimamente ligadas. Em situações em que você pode tirar amostras repetidas de uma população (essas ocasiões são raras), é útil gerar a distribuição de amostragem e a distribuição de bootstrap, uma após a outra, para ver como elas estão relacionadas.

Aqui, a estatística na qual você está interessado é a pontuação média de popularity das músicas.

spotify_population (todo o conjunto de dados) e spotify_sample (500 linhas amostradas aleatoriamente de spotify_population) estão disponíveis; pandas e numpy estão carregados com seus nomes alternativos habituais.

Este exercicio faz parte do curso

Amostragem em Python

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

mean_popularity_2000_samp = []

# Generate a sampling distribution of 2000 replicates
____:
    mean_popularity_2000_samp.append(
    	# Sample 500 rows and calculate the mean popularity 
    	____
    )

# Print the sampling distribution results
print(mean_popularity_2000_samp)
Editar e Executar Código