EDA: Plot al je data
Om een grafisch overzicht van een gegevensset te krijgen, is het vaak handig om al je data te plotten. Plot in deze oefening alle splits voor alle vrouwelijke zwemmers in de 800 meter series. De data staan in de NumPy-arrays split_number en splits. De arrays zijn zo georganiseerd dat splits[i,j] de splittijd is voor zwemmer i bij split_number[j].
Deze oefening maakt deel uit van de cursus
Casestudies in statistisch denken
Oefeninstructies
- Schrijf een
for-lus die over de set splits van elke zwemmer loopt om:- De splittijd uit te zetten tegen het splitnummer. Gebruik de keywordargumenten
linewidth=1encolor='lightgray'.
- De splittijd uit te zetten tegen het splitnummer. Gebruik de keywordargumenten
- Bereken de gemiddelde splittijden voor elke afstand. Dit kan met de functie
np.mean()met het keywordargumentaxis=0. Dit verteltnp.mean()om de gemiddelden over de rijen te nemen, wat de gemiddelde splittijd voor elk splitnummer geeft. - Plot de gemiddelde splittijden (y-as) tegen het splitnummer (x-as) met de keywordargumenten
marker='.',linewidth=3enmarkersize=12. - Label de assen en toon de plot.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot the splits for each swimmer
for splitset in ____:
_ = ____(____, ____, lw=1, color='lightgray')
# Compute the mean split times
mean_splits = ____
# Plot the mean split times
# Label axes and show plot
_ = plt.xlabel('split number')
_ = plt.ylabel('split time (s)')
plt.show()