Les données confirment-elles notre histoire ?
Vous avez modélisé les « no-hitters » avec une loi exponentielle. Créez une ECDF à partir des données réelles. Superposez la CDF théorique à l’ECDF issue des données. Cela vous permet de vérifier que la loi exponentielle décrit bien les observations.
Il peut être utile de vous rappeler la fonction que vous avez créée dans le cours précédent pour calculer l’ECDF, ainsi que le code que vous avez écrit pour la tracer.
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Calculez une ECDF à partir du temps réel entre deux « no-hitters » (
nohitter_times). Utilisez la fonctionecdf()que vous avez écrite dans le cours préquel. - Créez une CDF à partir des échantillons théoriques que vous avez tirés dans le dernier exercice (
inter_nohitter_time). - Tracez
x_theorety_theoren ligne avecplt.plot(). Puis superposez l’ECDF des données réellesxetysous forme de points. Pour cela, vous devez préciser les arguments nommésmarker = '.'etlinestyle = 'none'en plus dexetydansplt.plot(). - Définissez une marge de 2 % sur le graphique.
- Affichez le graphique.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create an ECDF from real data: x, y
x, y = ____
# Create a CDF from theoretical samples: x_theor, y_theor
x_theor, y_theor = ____
# Overlay the plots
plt.plot(____, ____)
plt.plot(____, ____, marker=____, linestyle=____)
# Margins and axis labels
plt.margins(____)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Show the plot
plt.show()