ComeçarComece de graça

Geração de uma distribuição bootstrap

O processo de geração de uma distribuição de bootstrap é semelhante ao processo de geração de uma distribuição de amostragem; somente a primeira etapa é diferente.

Para criar uma distribuição de amostragem, você começa com a população e faz uma amostra sem substituição. Para fazer uma distribuição de bootstrap, você começa com uma amostra e faz uma amostragem com substituição. Depois disso, as etapas são as mesmas: calcule a estatística resumida na qual você tem interesse nessa amostra/reamostra e, em seguida, replique o processo várias vezes. Em cada caso, você pode visualizar a distribuição usando um histograma.

Aqui, spotify_sample é um subconjunto do conjunto de dados spotify_population. Para facilitar a visualização do funcionamento da reamostragem, foi adicionada uma coluna de índice de linha chamada 'index', e somente as colunas nome do artista, nome da música e danceability foram incluídas.

spotify_sample está disponível como pandas. numpy e matplotlib.pyplot foram carregados com os nomes alternativos usuais.

Este exercício faz parte do curso

Amostragem em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Generate 1 bootstrap resample
spotify_1_resample = ____

# Print the resample
print(spotify_1_resample)
Editar e executar o código