Variación en las estadísticas muestrales
Si creamos una muestra de size=1000 extrayendo esa cantidad de puntos de una población, y luego calculamos una estadística muestral, como la media, obtenemos un único valor que resume la muestra.
Si repites ese proceso de muestreo num_samples=100 veces, obtendrás 100 muestras. Calcular la estadística muestral, como la media, para cada una de las diferentes muestras dará lugar a una distribución de valores de la media. El objetivo es entonces calcular la media de las medias y la desviación estándar de las medias.
Aquí usarás las variables precargadas population, num_samples y num_pts, y ten en cuenta que los arrays means y deviations se han inicializado a cero para proporcionarte contenedores que usar en el bucle for.
Este ejercicio forma parte del curso
Introducción al modelado lineal en Python
Instrucciones del ejercicio
- Para cada una de las
num_samples=100, genera una muestra y luego calcula y almacena las estadísticas muestrales. - En cada iteración, crea un
sampleusandonp.random.choice()para extraer1000puntos aleatorios de la población. - En cada iteración, calcula y guarda los resultados de los métodos
sample.mean()ysample.std()para obtener la media y la desviación estándar de la muestra. - Para el array
meansy el arraydeviations, calcula tanto la media como la desviación estándar de cada uno e imprime los resultados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Initialize two arrays of zeros to be used as containers
means = np.zeros(num_samples)
stdevs = np.zeros(num_samples)
# For each iteration, compute and store the sample mean and sample stdev
for ns in range(num_samples):
sample = np.____.choice(population, num_pts)
means[ns] = sample.____()
stdevs[ns] = sample.____()
# Compute and print the mean() and std() for the sample statistic distributions
print("Means: center={:>6.2f}, spread={:>6.2f}".format(means.mean(), means.std()))
print("Stdevs: center={:>6.2f}, spread={:>6.2f}".format(stdevs.____(), stdevs.____()))