EDA: Plotte alle deine Daten
Um einen grafischen Überblick über einen Datensatz zu bekommen, ist es oft hilfreich, alle Daten zu plotten. In dieser Übung sollst du alle Splits für alle Schwimmerinnen in den 800-m-Vorläufen plotten. Die Daten liegen in den NumPy-Arrays split_number und splits vor. Die Arrays sind so organisiert, dass splits[i,j] die Zwischenzeit von Schwimmerin i für split_number[j] ist.
Diese Übung ist Teil des Kurses
Fallstudien zum statistischen Denken
Anleitung zur Übung
- Schreibe eine
for-Schleife, die über die Splits jeder Schwimmerin iteriert, um:- die Zwischenzeit gegen die Split-Nummer zu plotten. Verwende die Keyword-Argumente
linewidth=1undcolor='lightgray'.
- die Zwischenzeit gegen die Split-Nummer zu plotten. Verwende die Keyword-Argumente
- Berechne die mittleren Zwischenzeiten für jede Distanz. Das kannst du mit der Funktion
np.mean()und dem Keyword-Argumentaxis=0tun. Damit weist dunp.mean()an, die Mittelwerte über die Zeilen zu berechnen, was dir die mittlere Zwischenzeit für jede Split-Nummer liefert. - Plotte die mittleren Zwischenzeiten (y-Achse) gegen die Split-Nummer (x-Achse) mit den Keyword-Argumenten
marker='.',linewidth=3undmarkersize=12. - Beschrifte die Achsen und zeige den Plot an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plot the splits for each swimmer
for splitset in ____:
_ = ____(____, ____, lw=1, color='lightgray')
# Compute the mean split times
mean_splits = ____
# Plot the mean split times
# Label axes and show plot
_ = plt.xlabel('split number')
_ = plt.ylabel('split time (s)')
plt.show()