Invariância no tempo
Embora você deva sempre começar visualizando seus dados brutos, isso muitas vezes não ajuda a diferenciar duas classes de pontos de dados. Os dados geralmente têm ruído ou exibem padrões complexos que não são perceptíveis a olho nu.
Outra técnica comum para encontrar diferenças simples entre dois conjuntos de dados é fazer a média de várias instâncias da mesma classe. Isso pode remover ruídos e revelar padrões subjacentes (ou não).
Neste exercício, você vai calcular a média de várias instâncias de cada classe de som de batimento cardíaco.
Os dois DataFrames (normal e abnormal) e o array de tempo (time) do exercício anterior estão disponíveis no seu ambiente de trabalho.
Este exercício faz parte do curso
Machine Learning para dados de séries temporais em Python
Instruções do exercício
- Calcule a média dos arquivos de áudio contidos em
normaleabnormal, mantendo a dimensão do tempo. - Visualize essas médias ao longo do tempo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)
# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()