ComenzarEmpieza gratis

Réplicas bootstrap de la media y el SEM

En este ejercicio, vas a calcular una estimación bootstrap de la función de densidad de probabilidad de la media de la precipitación anual en la estación meteorológica de Sheffield. Recuerda: estamos estimando la media de precipitación anual que obtendríamos si la estación de Sheffield pudiera repetir todas las mediciones de 1883 a 2015 una y otra vez. Esta es una estimación probabilística de la media. Representarás la PDF como un histograma y verás que es Normal.

De hecho, puede demostrarse teóricamente que, bajo condiciones no demasiado restrictivas, el valor de la media siempre sigue una distribución Normal. (Esto no se cumple en general, solo para la media y unas pocas estadísticas más). La desviación estándar de esta distribución, llamada error estándar de la media o SEM, se obtiene dividiendo la desviación estándar de los datos entre la raíz cuadrada del número de observaciones. Es decir, para un conjunto de datos, sem = np.std(data) / np.sqrt(len(data)). Usando hacker stats, obtienes este mismo resultado sin necesidad de derivarlo, y lo comprobarás con tus réplicas bootstrap.

El conjunto de datos ya está precargado en un array llamado rainfall.

Este ejercicio forma parte del curso

Pensamiento estadístico en Python (Parte 2)

Ver curso

Instrucciones del ejercicio

  • Extrae 10000 réplicas bootstrap de la media de la precipitación anual usando tu función draw_bs_reps() y el array rainfall. Pista: pasa np.mean como func para calcular la media.
    • Recuerda que draw_bs_reps() acepta 3 argumentos: data, func y size.
  • Calcula e imprime el error estándar de la media de rainfall.
    • La fórmula es np.std(data) / np.sqrt(len(data)).
  • Calcula e imprime la desviación estándar de tus réplicas bootstrap bs_replicates.
  • Haz un histograma de las réplicas usando el argumento normed=True y 50 bins.
  • Pulsa Enviar respuesta para ver la gráfica.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Take 10,000 bootstrap replicates of the mean: bs_replicates
bs_replicates = ____

# Compute and print SEM
sem = ____ / np.sqrt(____)
print(sem)

# Compute and print standard deviation of bootstrap replicates
bs_std = ____
print(bs_std)

# Make a histogram of the results
_ = plt.hist(____, ____=50, ____=True)
_ = plt.xlabel('mean annual rainfall (mm)')
_ = plt.ylabel('PDF')

# Show the plot
plt.show()
Editar y ejecutar código