Distribución normal
Pasamos a la distribución más reconocible y útil de todas: la normal o gaussiana. En las diapositivas, hablamos brevemente de su forma de campana y de cómo la distribución normal, junto con el teorema central del límite, nos permite realizar contrastes de hipótesis.
Al igual que en los ejercicios anteriores, aquí empezarás simulando algunos datos y examinando la distribución; luego profundizarás un poco más y analizarás la probabilidad de que ocurran ciertas observaciones.
Este ejercicio forma parte del curso
Practicando preguntas de entrevistas de estadística en Python
Instrucciones del ejercicio
- Genera los datos de la distribución usando la función
rvs()con size igual a 1000; asígnalos a la variabledata. - Muestra un histograma con
matplotliby examina la forma de la distribución. - Dada una distribución normal tipificada, ¿cuál es la probabilidad de una observación mayor que 2?
- Mirando nuestra muestra, ¿cuál es la probabilidad de una observación mayor que 2?
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Generate normal data
from scipy.stats import norm
data = norm.rvs(size=____)
# Plot distribution
plt.hist(____)
plt.show()
# Compute and print true probability for greater than 2
true_prob = 1 - norm.cdf(____)
print(____)
# Compute and print sample probability for greater than 2
sample_prob = sum(obs > ____ for obs in data) / len(____)
print(____)