Aan de slagGa gratis aan de slag

Waarom is deze parameter optimaal?

Trek nu steekproeven uit een Exponential-verdeling waarbij \(\tau\) twee keer zo groot is als de optimale \(\tau\). Doe dit ook voor een \(\tau\) die half zo groot is. Maak CDF's van deze steekproeven en leg ze over je data heen. Je ziet dat ze de data minder goed reproduceren. Dus, de \(\tau\) die je berekende uit de gemiddelde tussenpozen zonder no-hitters is optimaal omdat die de data het best weergeeft.

Let op: In deze en alle volgende oefeningen is de generator voor willekeurige getallen alvast voor je gezaaid, zodat je minder hoeft te typen.

Deze oefening maakt deel uit van de cursus

Statistical Thinking in Python (deel 2)

Cursus bekijken

Oefeninstructies

  • Neem 10000 steekproeven uit een Exponential-verdeling met parameter \(\tau_{1/2}\) = tau/2.
  • Neem 10000 steekproeven uit een Exponential-verdeling met parameter \(\tau_{2}\) = 2*tau.
  • Genereer CDF's van deze twee reeksen steekproeven met je functie ecdf().
  • Voeg deze twee CDF's als lijnen toe aan je plot. Dit is al voor je gedaan, dus klik op Antwoord verzenden om de plot te bekijken!

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot the theoretical CDFs
plt.plot(x_theor, y_theor)
plt.plot(x, y, marker='.', linestyle='none')
plt.margins(0.02)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')

# Take samples with half tau: samples_half
samples_half = ____

# Take samples with double tau: samples_double
samples_double = ____

# Generate CDFs from these samples
x_half, y_half = ____
x_double, y_double = ____

# Plot these CDFs as lines
_ = plt.plot(x_half, y_half)
_ = plt.plot(x_double, y_double)

# Show the plot
plt.show()
Code bewerken en uitvoeren