Volgen de data ons verhaal?
Je hebt no-hitters gemodelleerd met een Exponentiële verdeling. Maak een ECDF van de echte data. Leg de theoretische CDF over de ECDF van de data heen. Zo kun je controleren of de Exponentiële verdeling de geobserveerde data goed beschrijft.
Het kan handig zijn om nog eens te kijken naar de functie die je in de vorige cursus maakte om de ECDF te berekenen, en naar de code die je schreef om die te plotten.
Deze oefening maakt deel uit van de cursus
Statistical Thinking in Python (deel 2)
Oefeninstructies
- Bereken een ECDF van de werkelijke tijd tussen no-hitters (
nohitter_times). Gebruik de functieecdf()die je in de prequelcursus schreef. - Maak een CDF van de theoretische steekproeven die je in de vorige oefening nam (
inter_nohitter_time). - Plot
x_theoreny_theorals een lijn metplt.plot(). Leg daarna de ECDF van de echte dataxenyer als punten overheen. Hiervoor moet je naastxenyook de keyword-argumentenmarker = '.'enlinestyle = 'none'meegeven inplt.plot(). - Stel een marge van 2% in op de plot.
- Toon de plot.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create an ECDF from real data: x, y
x, y = ____
# Create a CDF from theoretical samples: x_theor, y_theor
x_theor, y_theor = ____
# Overlay the plots
plt.plot(____, ____)
plt.plot(____, ____, marker=____, linestyle=____)
# Margins and axis labels
plt.margins(____)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Show the plot
plt.show()