Warum ist dieser Parameter optimal?
Ziehe jetzt Stichproben aus einer Exponentialverteilung, bei der \(\tau\) doppelt so groß ist wie das optimale \(\tau\). Wiederhole das für ein \(\tau\), das halb so groß ist. Erzeuge KDFs dieser Stichproben und lege sie über deine Daten. Du wirst sehen, dass sie die Daten nicht so gut wiedergeben. Das von dir aus den mittleren Zeiten zwischen No-Hittern berechnete \(\tau\) ist daher optimal, weil es die Daten am besten reproduziert.
Hinweis: In dieser und allen folgenden Übungen ist der Zufallszahlengenerator bereits für dich vordefiniert, damit du dir Tipparbeit sparst.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 2)
Anleitung zur Übung
- Ziehe
10000Stichproben aus einer Exponentialverteilung mit dem Parameter \(\tau_{1/2}\) =tau/2. - Ziehe
10000Stichproben aus einer Exponentialverteilung mit dem Parameter \(\tau_{2}\) =2*tau. - Erzeuge aus diesen beiden Stichprobenmengen KDFs mit deiner Funktion
ecdf(). - Füge diese beiden KDFs als Linien zu deinem Plot hinzu. Das wurde bereits für dich erledigt – klicke einfach auf Antwort senden, um den Plot zu sehen!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plot the theoretical CDFs
plt.plot(x_theor, y_theor)
plt.plot(x, y, marker='.', linestyle='none')
plt.margins(0.02)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Take samples with half tau: samples_half
samples_half = ____
# Take samples with double tau: samples_double
samples_double = ____
# Generate CDFs from these samples
x_half, y_half = ____
x_double, y_double = ____
# Plot these CDFs as lines
_ = plt.plot(x_half, y_half)
_ = plt.plot(x_double, y_double)
# Show the plot
plt.show()