En quoi ce paramètre est-il optimal ?
Échantillonnez maintenant une loi exponentielle avec un \(\tau\) deux fois plus grand que le \(\tau\) optimal. Recommencez avec un \(\tau\) deux fois plus petit. Calculez les CDF de ces échantillons et superposez-les à vos données. Vous verrez qu’elles reproduisent moins bien les données. Ainsi, le \(\tau\) que vous avez calculé à partir des temps moyens entre no-hitters est optimal, car c’est celui qui reproduit le mieux les données.
Remarque : Dans cet exercice et tous les suivants, le générateur de nombres aléatoires est pré-initialisé pour vous éviter de taper du code supplémentaire.
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Prenez
10000échantillons d’une loi exponentielle de paramètre \(\tau_{1/2}\) =tau/2. - Prenez
10000échantillons d’une loi exponentielle de paramètre \(\tau_{2}\) =2*tau. - Générez les CDF de ces deux ensembles d’échantillons avec votre fonction
ecdf(). - Ajoutez ces deux CDF comme courbes à votre graphique. Cela a été fait pour vous ; il vous suffit de Soumettre pour afficher le graphique !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plot the theoretical CDFs
plt.plot(x_theor, y_theor)
plt.plot(x, y, marker='.', linestyle='none')
plt.margins(0.02)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Take samples with half tau: samples_half
samples_half = ____
# Take samples with double tau: samples_double
samples_double = ____
# Generate CDFs from these samples
x_half, y_half = ____
x_double, y_double = ____
# Plot these CDFs as lines
_ = plt.plot(x_half, y_half)
_ = plt.plot(x_double, y_double)
# Show the plot
plt.show()