Os dados seguem a nossa história?
Você modelou no-hitters usando uma distribuição Exponential. Crie uma ECDF dos dados reais. Sobreponha a CDF teórica com a ECDF dos dados. Isso ajuda a verificar se a distribuição Exponential descreve os dados observados.
Pode ser útil relembrar a função que você criou no curso anterior para calcular a ECDF, bem como o código que você escreveu para plotá-la.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Calcule uma ECDF a partir do tempo real entre no-hitters (
nohitter_times). Use a funçãoecdf()que você escreveu no curso prequel. - Crie uma CDF a partir das amostras teóricas que você obteve no último exercício (
inter_nohitter_time). - Plote
x_theorey_theorcomo uma linha usandoplt.plot(). Depois, sobreponha a ECDF dos dados reaisxeycomo pontos. Para isso, você precisa especificar os argumentos nomeadosmarker = '.'elinestyle = 'none'além dexeydentro deplt.plot(). - Defina uma margem de 2% no gráfico.
- Mostre o gráfico.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create an ECDF from real data: x, y
x, y = ____
# Create a CDF from theoretical samples: x_theor, y_theor
x_theor, y_theor = ____
# Overlay the plots
plt.plot(____, ____)
plt.plot(____, ____, marker=____, linestyle=____)
# Margins and axis labels
plt.margins(____)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Show the plot
plt.show()