Aan de slagGa gratis aan de slag

Volgen de data ons verhaal?

Je hebt no-hitters gemodelleerd met een Exponentiële verdeling. Maak een ECDF van de echte data. Leg de theoretische CDF over de ECDF van de data heen. Zo kun je controleren of de Exponentiële verdeling de geobserveerde data goed beschrijft.

Het kan handig zijn om nog eens te kijken naar de functie die je in de vorige cursus maakte om de ECDF te berekenen, en naar de code die je schreef om die te plotten.

Deze oefening maakt deel uit van de cursus

Statistical Thinking in Python (deel 2)

Cursus bekijken

Oefeninstructies

  • Bereken een ECDF van de werkelijke tijd tussen no-hitters (nohitter_times). Gebruik de functie ecdf() die je in de prequelcursus schreef.
  • Maak een CDF van de theoretische steekproeven die je in de vorige oefening nam (inter_nohitter_time).
  • Plot x_theor en y_theor als een lijn met plt.plot(). Leg daarna de ECDF van de echte data x en y er als punten overheen. Hiervoor moet je naast x en y ook de keyword-argumenten marker = '.' en linestyle = 'none' meegeven in plt.plot().
  • Stel een marge van 2% in op de plot.
  • Toon de plot.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create an ECDF from real data: x, y
x, y = ____

# Create a CDF from theoretical samples: x_theor, y_theor
x_theor, y_theor = ____

# Overlay the plots
plt.plot(____, ____)
plt.plot(____, ____, marker=____, linestyle=____)

# Margins and axis labels
plt.margins(____)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')

# Show the plot
plt.show()
Code bewerken en uitvoeren