Geração de uma distribuição bootstrap
O processo de geração de uma distribuição de bootstrap é semelhante ao processo de geração de uma distribuição de amostragem; somente a primeira etapa é diferente.
Para criar uma distribuição de amostragem, você começa com a população e faz uma amostra sem substituição. Para fazer uma distribuição de bootstrap, você começa com uma amostra e faz uma amostragem com substituição. Depois disso, as etapas são as mesmas: calcule a estatística resumida na qual você tem interesse nessa amostra/reamostra e, em seguida, replique o processo várias vezes. Em cada caso, você pode visualizar a distribuição usando um histograma.
Aqui, spotify_sample
é um subconjunto do conjunto de dados spotify_population
. Para facilitar a visualização do funcionamento da reamostragem, foi adicionada uma coluna de índice de linha chamada 'index'
, e somente as colunas nome do artista, nome da música e danceability
foram incluídas.
spotify_sample
está disponível como pandas
. numpy
e matplotlib.pyplot
foram carregados com os nomes alternativos usuais.
Este exercício faz parte do curso
Amostragem em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)