ComeçarComece de graça

EDA: Plote todos os seus dados

Para obter uma visão gráfica de um conjunto de dados, muitas vezes é útil plotar todos os seus dados. Neste exercício, plote todas as parciais de todas as nadadoras nas eliminatórias dos 800 metros. Os dados estão disponíveis nos arrays do NumPy split_number e splits. Os arrays são organizados de modo que splits[i,j] é o tempo de parcial da nadadora i para split_number[j].

Este exercício faz parte do curso

Estudos de caso em pensamento estatístico

Ver curso

Instruções do exercício

  • Escreva um loop for, percorrendo o conjunto de parciais de cada nadadora para:
    • Plotar o tempo de parcial versus o número da parcial. Use os argumentos nomeados linewidth=1 e color='lightgray'.
  • Calcule os tempos médios de parcial para cada distância. Você pode fazer isso usando a função np.mean() com o argumento axis=0. Isso informa ao np.mean() para calcular as médias ao longo das linhas, o que dará o tempo médio de cada número de parcial.
  • Plote os tempos médios de parcial (eixo y) versus o número da parcial (eixo x) usando os argumentos marker='.', linewidth=3 e markersize=12.
  • Rotule os eixos e mostre o gráfico.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Plot the splits for each swimmer
for splitset in ____:
    _ = ____(____, ____, lw=1, color='lightgray')

# Compute the mean split times
mean_splits = ____

# Plot the mean split times


# Label axes and show plot
_ = plt.xlabel('split number')
_ = plt.ylabel('split time (s)')
plt.show()
Editar e executar o código