Invariancia en el tiempo
Aunque siempre deberías empezar visualizando los datos en bruto, esto a menudo no es informativo para distinguir entre dos clases de puntos de datos. Los datos suelen tener ruido o mostrar patrones complejos que no se detectan a simple vista.
Otra técnica común para encontrar diferencias simples entre dos conjuntos de datos es calcular la media a lo largo de múltiples instancias de la misma clase. Esto puede eliminar ruido y revelar patrones subyacentes (o no).
En este ejercicio, vas a promediar muchas instancias de cada clase de sonido de latido.
Los dos DataFrames (normal y abnormal) y el array de tiempos (time) del ejercicio anterior están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Machine Learning para datos de series temporales en Python
Instrucciones del ejercicio
- Calcula la media de los archivos de audio contenidos en
normalyabnormal, conservando la dimensión temporal. - Visualiza estas medias a lo largo del tiempo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)
# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()