ComeçarComece de graça

Distribuição normal

Vamos para a distribuição mais reconhecida e útil do grupo: a normal, ou Gaussiana. Nos slides, falamos rapidamente sobre o formato em sino e como a distribuição normal, junto com o teorema do limite central, permite que a gente realize testes de hipótese.

Assim como nos exercícios anteriores, aqui você vai começar simulando alguns dados e examinando a distribuição. Depois, vai se aprofundar um pouco e analisar a probabilidade de certas observações acontecerem.

Este exercício faz parte do curso

Praticando perguntas de entrevista de Estatística em Python

Ver curso

Instruções do exercício

  • Gere os dados da distribuição usando a função rvs() com size igual a 1000; atribua à variável data.
  • Exiba um histograma do matplotlib; observe o formato da distribuição.
  • Dada uma distribuição normal padronizada, qual é a probabilidade de uma observação ser maior que 2?
  • Olhando para a nossa amostra, qual é a probabilidade de uma observação ser maior que 2?

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Generate normal data
from scipy.stats import norm
data = norm.rvs(size=____)

# Plot distribution
plt.hist(____)
plt.show()

# Compute and print true probability for greater than 2
true_prob = 1 - norm.cdf(____)
print(____)

# Compute and print sample probability for greater than 2
sample_prob = sum(obs > ____ for obs in data) / len(____)
print(____)
Editar e executar o código