La media de las medias
Quieres saber cuál es el número medio de usuarios (num_users
) por acuerdo, pero quieres conocer este número para toda la empresa, de modo que puedas ver si los acuerdos de Amir tienen más o menos usuarios que el acuerdo medio de la empresa. El problema es que, en el último año, la empresa ha trabajado en más de 10 000 acuerdos, por lo que no es realista recopilar todos los datos. En vez de eso, estimarás la media tomando varias muestras aleatorias de acuerdos, ya que esto es mucho más fácil que recopilar datos de todas las personas de la empresa.
amir_deals
está disponible y los datos de usuario de todos los acuerdos de la empresa están disponibles en all_deals
. Se ha cargado pandas
como pd
y numpy
como np
.
Este ejercicio forma parte del curso
Introducción a la estadística en Python
Instrucciones del ejercicio
- Establece la semilla aleatoria en
321
. - Toma 30 muestras (con reemplazo) con un tamaño de 20 de
all_deals['num_users']
y calcula la media de cada muestra. Guarda las medias muestrales ensample_means
. - Imprime la media de
sample_means
. - Imprime la media de la columna
num_users
deamir_deals
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)