EDA: Plote todos os seus dados
Para obter uma visão gráfica de um conjunto de dados, muitas vezes é útil plotar todos os seus dados. Neste exercício, plote todas as parciais de todas as nadadoras nas eliminatórias dos 800 metros. Os dados estão disponíveis nos arrays do NumPy split_number e splits. Os arrays são organizados de modo que splits[i,j] é o tempo de parcial da nadadora i para split_number[j].
Este exercício faz parte do curso
Estudos de caso em pensamento estatístico
Instruções do exercício
- Escreva um loop
for, percorrendo o conjunto de parciais de cada nadadora para:- Plotar o tempo de parcial versus o número da parcial. Use os argumentos nomeados
linewidth=1ecolor='lightgray'.
- Plotar o tempo de parcial versus o número da parcial. Use os argumentos nomeados
- Calcule os tempos médios de parcial para cada distância. Você pode fazer isso usando a função
np.mean()com o argumentoaxis=0. Isso informa aonp.mean()para calcular as médias ao longo das linhas, o que dará o tempo médio de cada número de parcial. - Plote os tempos médios de parcial (eixo y) versus o número da parcial (eixo x) usando os argumentos
marker='.',linewidth=3emarkersize=12. - Rotule os eixos e mostre o gráfico.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the splits for each swimmer
for splitset in ____:
_ = ____(____, ____, lw=1, color='lightgray')
# Compute the mean split times
mean_splits = ____
# Plot the mean split times
# Label axes and show plot
_ = plt.xlabel('split number')
_ = plt.ylabel('split time (s)')
plt.show()