Invariance dans le temps
Même s’il faut toujours commencer par visualiser vos données brutes, cela aide rarement à distinguer clairement deux classes de points de données. Les données sont souvent bruitées ou présentent des motifs complexes invisibles à l’œil nu.
Une autre technique courante pour mettre en évidence des différences simples entre deux ensembles de données consiste à faire une moyenne sur plusieurs instances d’une même classe. Cela peut éliminer du bruit et révéler des motifs sous-jacents (ou pas).
Dans cet exercice, vous allez faire la moyenne sur de nombreuses instances de chaque classe de sons de battements cardiaques.
Les deux DataFrames (normal et abnormal) et le tableau de temps (time) de l’exercice précédent sont disponibles dans votre espace de travail.
Cet exercice fait partie du cours
Machine Learning for Time Series Data in Python
Instructions
- Calculez la moyenne sur les fichiers audio contenus dans
normaletabnormal, en conservant la dimension temporelle. - Visualisez ces moyennes au fil du temps.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)
# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()