Invariância no tempo
Embora você deva sempre começar visualizando seus dados brutos, isso geralmente não é informativo quando se trata de discriminar entre duas classes de pontos de dados. Os dados geralmente são ruidosos ou apresentam padrões complexos que não podem ser descobertos a olho nu.
Outra técnica comum para encontrar diferenças simples entre dois conjuntos de dados é calcular a média de várias instâncias da mesma classe. Isso pode remover o ruído e revelar padrões subjacentes (ou não).
Neste exercício, você calculará a média de várias instâncias de cada classe de som de batimento cardíaco.
Os dois DataFrames (normal e abnormal) e a matriz de tempo (time) do exercício anterior estão disponíveis em seu espaço de trabalho.
Este exercício faz parte do curso
Aprendizado de máquina para dados de séries temporais em Python
Instruções do exercício
- Média dos arquivos de áudio contidos em
normaleabnormal, deixando a dimensão de tempo. - Visualize essas médias ao longo do tempo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)
# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()