1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Studia przypadków w myśleniu statystycznym

Connected

Cvičení

EDA: Wizualizacja wszystkich danych

Aby uzyskać graficzny przegląd zbioru danych, warto zwizualizować wszystkie dostępne dane. W tym ćwiczeniu narysuj wszystkie czasy odcinków dla wszystkich zawodniczek pływających w eliminacjach na dystansie 800 metrów. Dane są dostępne w tablicach NumPy split_number i splits. Tablice są zorganizowane tak, że splits[i,j] to czas odcinka zawodniczki i dla numeru odcinka split_number[j].

Pokyny

100 XP
  • Napisz pętlę for, iterując po zestawach czasów odcinków dla każdej zawodniczki, aby:
    • Narysować czas odcinka w zależności od numeru odcinka. Użyj argumentów kluczowych linewidth=1 i color='lightgray'.
  • Oblicz średnie czasy odcinków dla każdego dystansu. Możesz to zrobić za pomocą funkcji np.mean() z argumentem kluczowym axis=0. Informuje to np.mean(), aby obliczało średnie po wierszach, co da średni czas odcinka dla każdego numeru odcinka.
  • Narysuj średnie czasy odcinków (oś y) w zależności od numeru odcinka (oś x), używając argumentów kluczowych marker='.', linewidth=3 i markersize=12.
  • Opisz osie i wyświetl wykres.