Invarianza en el tiempo
Aunque siempre debes empezar visualizando tus datos brutos, esto suele ser poco informativo cuando se trata de discriminar entre dos clases de puntos de datos. Los datos suelen ser ruidosos o presentan patrones complejos que no se pueden descubrir a simple vista.
Otra técnica habitual para encontrar diferencias sencillas entre dos conjuntos de datos es hacer la media entre varias instancias de la misma clase. Esto puede eliminar el ruido y revelar patrones subyacentes (o, puede que no).
En este ejercicio, harás un promedio de muchas instancias de cada clase de sonido de latido.
Los dos DataFrames (normal
y abnormal
) y la matriz de tiempo (time
) del ejercicio anterior están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Machine learning para datos de series temporales en Python
Instrucciones de ejercicio
- Media de los archivos de audio contenidos en
normal
yabnormal
, dejando la dimensión temporal. - Visualiza estas medias a lo largo del tiempo.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)
# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()