Generar una distribución bootstrap
El proceso para generar una distribución bootstrap es similar al proceso para generar una distribución muestral; solo el primer paso es diferente.
Para hacer una distribución muestral, se parte de la población y se muestrea sin reemplazo. Para hacer una distribución bootstrap, empiezas con una muestra y la muestreas con reemplazo. Después, los pasos son los mismos: calcula la estadística de resumen que te interese en esa muestra/remuestra y, a continuación, repite el proceso muchas veces. En cada caso, puedes visualizar la distribución con un histograma.
Aquí, spotify_sample es un subconjunto del conjunto de datos spotify_population. Para que sea más fácil ver cómo funciona el remuestreo, se ha añadido una columna de índice de fila llamada 'index', y solo se han incluido las columnas de nombre de artista, nombre de canción y danceability.
spotify_sample está disponible como pandas. numpy y matplotlib.pyplot se cargan con sus alias habituales.
Este ejercicio forma parte del curso
Muestreo en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)