Gerando uma distribuição bootstrap
O processo para gerar uma distribuição bootstrap é muito parecido com o processo para gerar uma distribuição amostral; apenas a primeira etapa é diferente.
Para fazer uma distribuição amostral, você começa com a população e amostra sem reposição. Para fazer uma distribuição bootstrap, você começa com uma amostra e faz novas amostragens dessa amostra com reposição. Depois disso, as etapas são as mesmas: calcular a estatística-resumo de interesse nessa amostra/reamostra e então repetir o processo muitas vezes. Em ambos os casos, você pode visualizar a distribuição com um histograma.
Aqui, spotify_sample é um subconjunto do conjunto de dados spotify_population. Para facilitar a visualização de como o reamostragem funciona, foi adicionada uma coluna de ID de linha, e apenas o nome do artista, o nome da música e as colunas de danceability foram incluídas.
spotify_sample está disponível; dplyr e ggplot2 estão carregados.
Este exercício faz parte do curso
Amostragem em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generate 1 bootstrap resample
spotify_1_resample <- ___
# See the result
spotify_1_resample