Por que esse parâmetro é ótimo?
Agora amostre de uma distribuição exponencial com \(\tau\) sendo duas vezes maior que o \(\tau\) ótimo. Faça o mesmo para um \(\tau\) metade desse valor. Construa CDFs dessas amostras e sobreponha-as aos seus dados. Você verá que elas não reproduzem os dados tão bem. Assim, o \(\tau\) que você calculou a partir dos tempos médios entre no-hitters é ótimo no sentido de que melhor reproduz os dados.
Observação: Neste e em todos os próximos exercícios, o gerador de números aleatórios já está com semente definida para você, para poupar digitação.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Pegue
10000amostras de uma distribuição Exponencial com parâmetro \(\tau_{1/2}\) =tau/2. - Pegue
10000amostras de uma distribuição Exponencial com parâmetro \(\tau_{2}\) =2*tau. - Gere CDFs a partir desses dois conjuntos de amostras usando sua função
ecdf(). - Adicione essas duas CDFs como linhas ao seu gráfico. Isso já foi feito para você, então clique em Enviar Resposta para ver o gráfico!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the theoretical CDFs
plt.plot(x_theor, y_theor)
plt.plot(x, y, marker='.', linestyle='none')
plt.margins(0.02)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Take samples with half tau: samples_half
samples_half = ____
# Take samples with double tau: samples_double
samples_double = ____
# Generate CDFs from these samples
x_half, y_half = ____
x_double, y_double = ____
# Plot these CDFs as lines
_ = plt.plot(x_half, y_half)
_ = plt.plot(x_double, y_double)
# Show the plot
plt.show()