ComeçarComece de graça

Os dados seguem a nossa história?

Você modelou no-hitters usando uma distribuição Exponential. Crie uma ECDF dos dados reais. Sobreponha a CDF teórica com a ECDF dos dados. Isso ajuda a verificar se a distribuição Exponential descreve os dados observados.

Pode ser útil relembrar a função que você criou no curso anterior para calcular a ECDF, bem como o código que você escreveu para plotá-la.

Este exercício faz parte do curso

Pensamento Estatístico em Python (Parte 2)

Ver curso

Instruções do exercício

  • Calcule uma ECDF a partir do tempo real entre no-hitters (nohitter_times). Use a função ecdf() que você escreveu no curso prequel.
  • Crie uma CDF a partir das amostras teóricas que você obteve no último exercício (inter_nohitter_time).
  • Plote x_theor e y_theor como uma linha usando plt.plot(). Depois, sobreponha a ECDF dos dados reais x e y como pontos. Para isso, você precisa especificar os argumentos nomeados marker = '.' e linestyle = 'none' além de x e y dentro de plt.plot().
  • Defina uma margem de 2% no gráfico.
  • Mostre o gráfico.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create an ECDF from real data: x, y
x, y = ____

# Create a CDF from theoretical samples: x_theor, y_theor
x_theor, y_theor = ____

# Overlay the plots
plt.plot(____, ____)
plt.plot(____, ____, marker=____, linestyle=____)

# Margins and axis labels
plt.margins(____)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')

# Show the plot
plt.show()
Editar e executar o código