ComenzarEmpieza gratis

La media de las medias

Quieres saber cuál es el número medio de usuarios (num_users) por acuerdo, pero quieres conocer este número para toda la empresa, de modo que puedas ver si los acuerdos de Amir tienen más o menos usuarios que el acuerdo medio de la empresa. El problema es que, en el último año, la empresa ha trabajado en más de 10 000 acuerdos, por lo que no es realista recopilar todos los datos. En vez de eso, estimarás la media tomando varias muestras aleatorias de acuerdos, ya que esto es mucho más fácil que recopilar datos de todas las personas de la empresa.

amir_deals está disponible y los datos de usuario de todos los acuerdos de la empresa están disponibles en all_deals. Se ha cargado pandas como pd y numpy como np.

Este ejercicio forma parte del curso

Introducción a la estadística en Python

Ver curso

Instrucciones del ejercicio

  • Establece la semilla aleatoria en 321.
  • Toma 30 muestras (con reemplazo) con un tamaño de 20 de all_deals['num_users'] y calcula la media de cada muestra. Guarda las medias muestrales en sample_means.
  • Imprime la media de sample_means.
  • Imprime la media de la columna num_users de amir_deals.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)
Editar y ejecutar código