La media de las medias

Quieres saber cuál es el número medio de usuarios (num_users) por acuerdo, pero quieres conocer este número para toda la empresa, de modo que puedas ver si los acuerdos de Amir tienen más o menos usuarios que el acuerdo medio de la empresa. El problema es que, en el último año, la empresa ha trabajado en más de 10 000 acuerdos, por lo que no es realista recopilar todos los datos. En vez de eso, estimarás la media tomando varias muestras aleatorias de acuerdos, ya que esto es mucho más fácil que recopilar datos de todas las personas de la empresa.

amir_deals está disponible y los datos de usuario de todos los acuerdos de la empresa están disponibles en all_deals. Se ha cargado pandas como pd y numpy como np.

Este ejercicio forma parte del curso

Introducción a la estadística en Python

Instrucciones del ejercicio

Establece la semilla aleatoria en 321.
Toma 30 muestras (con reemplazo) con un tamaño de 20 de all_deals['num_users'] y calcula la media de cada muestra. Guarda las medias muestrales en sample_means.
Imprime la media de sample_means.
Imprime la media de la columna num_users de amir_deals.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)

Editar y ejecutar código

Este ejercicio forma parte del curso

Introducción a la estadística en Python

IntermedioNivel de habilidad

4.8+

Empieza el curso gratis

La síntesis estadística te proporciona las herramientas que necesitas para condensar conjuntos de datos masivos y revelar lo más destacado. En este capítulo explorarás la síntesis estadística, lo que incluye la media, la mediana y la desviación típica, y aprenderás a realizar una interpretación exacta. También desarrollarás tus competencias de pensamiento crítico, lo que te permitirá elegir la mejor síntesis estadística para tus datos.

Exercise 1: ¿Qué es la estadística?Exercise 2: Estadística descriptiva e inferencial Exercise 3: Clasificación de los tipos de datos Exercise 4: Medidas de tendencia central Exercise 5: Cálculo de la media y la mediana Exercise 6: Media, mediana y forma de la distribución Exercise 7: Medidas de dispersión Exercise 8: Varianza y desviación típica Exercise 9: Cuartiles, cuantiles y quintiles Exercise 10: Encontrar valores atípicos mediante IQR

En este capítulo aprenderás a generar muestras aleatorias y a medir el azar utilizando la probabilidad. Trabajarás con datos de ventas del mundo real para calcular la probabilidad de éxito de un vendedor. Por último, utilizarás la distribución binomial para modelar eventos con resultados binarios.

Exercise 1: ¿Qué posibilidades hay?Exercise 2: ¿Con o sin reemplazo?Exercise 3: Cálculo de probabilidades Exercise 4: Muestreo de acuerdos Exercise 5: Distribuciones discretas Exercise 6: Crear una distribución de probabilidad Exercise 7: Identificar las distribuciones Exercise 8: Valor esperado frente a media muestral Exercise 9: Distribuciones continuas Exercise 10: ¿Qué distribución?Exercise 11: Copias de seguridad de datos Exercise 12: Simulación de tiempos de espera Exercise 13: La distribución binomial Exercise 14: Simular acuerdos de venta Exercise 15: Cálculo de probabilidades binomiales Exercise 16: ¿Cuántas ventas se conseguirán?

Es hora de explorar una de las distribuciones de probabilidad más importantes en estadística, la distribución normal. Crearás histogramas para representar distribuciones normales y comprenderás el teorema central del límite, antes de ampliar tus conocimientos de las funciones estadísticas añadiendo las distribuciones de Poisson, exponencial y t a tu repertorio.

Exercise 1: La distribución normal Exercise 2: Distribución de las ventas de Amir Exercise 3: Probabilidades de la distribución normal Exercise 4: Simulación de ventas en nuevas condiciones de mercado Exercise 5: ¿Qué mercado es mejor?Exercise 6: El teorema central del límite Exercise 7: Visualizar distribuciones muestrales Exercise 8: El TLC en acción Exercise 9: La media de las medias

Ejercicio actual

Exercise 10: La distribución de Poisson Exercise 11: Identificar lambda Exercise 12: Seguimiento de las respuestas de los clientes potenciales Exercise 13: Más distribuciones de probabilidad Exercise 14: Arrastrar y colocar distribuciones Exercise 15: Tiempo de modelado entre clientes potenciales Exercise 16: La distribución t

En este capítulo, aprenderás a cuantificar la fuerza de una relación lineal entre dos variables, y explorarás cómo las variables de confusión pueden afectar a la relación entre otras dos variables. También verás cómo el diseño de un estudio puede influir en sus resultados, cambiar la forma en que deben analizarse los datos y afectar potencialmente a la fiabilidad de tus conclusiones.

Exercise 1: Correlación Exercise 2: Adivina la correlación Exercise 3: Relaciones entre variables Exercise 4: Advertencias sobre la correlación Exercise 5: ¿Qué no puede medir la correlación?Exercise 6: Transformación de variables Exercise 7: ¿El azúcar aumenta la felicidad?Exercise 8: Factores de confusión Exercise 9: Diseño de experimentos Exercise 10: Tipos de estudio Exercise 11: Estudios longitudinales frente a estudios transversales Exercise 12: ¡Enhorabuena!