Generar una distribución bootstrap
El proceso para generar una distribución bootstrap es similar al proceso para generar una distribución muestral; solo el primer paso es diferente.
Para hacer una distribución muestral, se parte de la población y se muestrea sin reemplazo. Para hacer una distribución bootstrap, empiezas con una muestra y la muestreas con reemplazo. Después, los pasos son los mismos: calcula la estadística de resumen que te interese en esa muestra/remuestra y, a continuación, repite el proceso muchas veces. En cada caso, puedes visualizar la distribución con un histograma.
Aquí, spotify_sample
es un subconjunto del conjunto de datos spotify_population
. Para que sea más fácil ver cómo funciona el remuestreo, se ha añadido una columna de índice de fila llamada 'index'
, y solo se han incluido las columnas de nombre de artista, nombre de canción y danceability
.
spotify_sample
está disponible como pandas
. numpy
y matplotlib.pyplot
se cargan con sus alias habituales.
Este ejercicio forma parte del curso
Muestreo en Python
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)