Distribución muestral vs. distribución bootstrap
La distribución muestral y la distribución bootstrap están estrechamente relacionadas. En situaciones en las que puedes muestrear repetidamente de una población (estas ocasiones son raras), es útil generar tanto la distribución de muestreo como la distribución bootstrap, una tras otra, para ver cómo se relacionan.
Aquí, la estadística que te interesa es la puntuación media popularity
de las canciones.
spotify_population
(todo el conjunto de datos) y spotify_sample
(500
filas muestreadas aleatoriamente de spotify_population
) están disponibles; pandas
y numpy
se cargan con sus alias habituales.
Este ejercicio forma parte del curso
Muestreo en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
mean_popularity_2000_samp = []
# Generate a sampling distribution of 2000 replicates
____:
mean_popularity_2000_samp.append(
# Sample 500 rows and calculate the mean popularity
____
)
# Print the sampling distribution results
print(mean_popularity_2000_samp)