Distribuição normal
Vamos para a distribuição mais reconhecida e útil do grupo: a normal, ou Gaussiana. Nos slides, falamos rapidamente sobre o formato em sino e como a distribuição normal, junto com o teorema do limite central, permite que a gente realize testes de hipótese.
Assim como nos exercícios anteriores, aqui você vai começar simulando alguns dados e examinando a distribuição. Depois, vai se aprofundar um pouco e analisar a probabilidade de certas observações acontecerem.
Este exercício faz parte do curso
Praticando perguntas de entrevista de Estatística em Python
Instruções do exercício
- Gere os dados da distribuição usando a função
rvs()com size igual a 1000; atribua à variáveldata. - Exiba um histograma do
matplotlib; observe o formato da distribuição. - Dada uma distribuição normal padronizada, qual é a probabilidade de uma observação ser maior que 2?
- Olhando para a nossa amostra, qual é a probabilidade de uma observação ser maior que 2?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generate normal data
from scipy.stats import norm
data = norm.rvs(size=____)
# Plot distribution
plt.hist(____)
plt.show()
# Compute and print true probability for greater than 2
true_prob = 1 - norm.cdf(____)
print(____)
# Compute and print sample probability for greater than 2
sample_prob = sum(obs > ____ for obs in data) / len(____)
print(____)