Invariância no tempo
Embora você deva sempre começar visualizando seus dados brutos, isso geralmente não é informativo quando se trata de discriminar entre duas classes de pontos de dados. Os dados geralmente são ruidosos ou apresentam padrões complexos que não podem ser descobertos a olho nu.
Outra técnica comum para encontrar diferenças simples entre dois conjuntos de dados é calcular a média de várias instâncias da mesma classe. Isso pode remover o ruído e revelar padrões subjacentes (ou não).
Neste exercício, você calculará a média de várias instâncias de cada classe de som de batimento cardíaco.
Os dois DataFrames (normal
e abnormal
) e a matriz de tempo (time
) do exercício anterior estão disponíveis em seu espaço de trabalho.
Este exercício faz parte do curso
Aprendizado de máquina para dados de séries temporais em Python
Instruções do exercício
- Média dos arquivos de áudio contidos em
normal
eabnormal
, deixando a dimensão de tempo. - Visualize essas médias ao longo do tempo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)
# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()