CommencerCommencer gratuitement

Les données confirment-elles notre histoire ?

Vous avez modélisé les « no-hitters » avec une loi exponentielle. Créez une ECDF à partir des données réelles. Superposez la CDF théorique à l’ECDF issue des données. Cela vous permet de vérifier que la loi exponentielle décrit bien les observations.

Il peut être utile de vous rappeler la fonction que vous avez créée dans le cours précédent pour calculer l’ECDF, ainsi que le code que vous avez écrit pour la tracer.

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Calculez une ECDF à partir du temps réel entre deux « no-hitters » (nohitter_times). Utilisez la fonction ecdf() que vous avez écrite dans le cours préquel.
  • Créez une CDF à partir des échantillons théoriques que vous avez tirés dans le dernier exercice (inter_nohitter_time).
  • Tracez x_theor et y_theor en ligne avec plt.plot(). Puis superposez l’ECDF des données réelles x et y sous forme de points. Pour cela, vous devez préciser les arguments nommés marker = '.' et linestyle = 'none' en plus de x et y dans plt.plot().
  • Définissez une marge de 2 % sur le graphique.
  • Affichez le graphique.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create an ECDF from real data: x, y
x, y = ____

# Create a CDF from theoretical samples: x_theor, y_theor
x_theor, y_theor = ____

# Overlay the plots
plt.plot(____, ____)
plt.plot(____, ____, marker=____, linestyle=____)

# Margins and axis labels
plt.margins(____)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')

# Show the plot
plt.show()
Modifier et exécuter le code