Aan de slagGa gratis aan de slag

EDA: Plot al je data

Om een grafisch overzicht van een gegevensset te krijgen, is het vaak handig om al je data te plotten. Plot in deze oefening alle splits voor alle vrouwelijke zwemmers in de 800 meter series. De data staan in de NumPy-arrays split_number en splits. De arrays zijn zo georganiseerd dat splits[i,j] de splittijd is voor zwemmer i bij split_number[j].

Deze oefening maakt deel uit van de cursus

Casestudies in statistisch denken

Cursus bekijken

Oefeninstructies

  • Schrijf een for-lus die over de set splits van elke zwemmer loopt om:
    • De splittijd uit te zetten tegen het splitnummer. Gebruik de keywordargumenten linewidth=1 en color='lightgray'.
  • Bereken de gemiddelde splittijden voor elke afstand. Dit kan met de functie np.mean() met het keywordargument axis=0. Dit vertelt np.mean() om de gemiddelden over de rijen te nemen, wat de gemiddelde splittijd voor elk splitnummer geeft.
  • Plot de gemiddelde splittijden (y-as) tegen het splitnummer (x-as) met de keywordargumenten marker='.', linewidth=3 en markersize=12.
  • Label de assen en toon de plot.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot the splits for each swimmer
for splitset in ____:
    _ = ____(____, ____, lw=1, color='lightgray')

# Compute the mean split times
mean_splits = ____

# Plot the mean split times


# Label axes and show plot
_ = plt.xlabel('split number')
_ = plt.ylabel('split time (s)')
plt.show()
Code bewerken en uitvoeren