Invarianz in der Zeit
Auch wenn du immer damit beginnen solltest, deine Rohdaten zu visualisieren, ist das oft wenig hilfreich, wenn es darum geht, zwischen zwei Klassen von Datenpunkten zu unterscheiden. Daten sind meist verrauscht oder zeigen komplexe Muster, die man mit bloßem Auge nicht erkennt.
Eine weitere gängige Technik, um einfache Unterschiede zwischen zwei Datensätzen zu finden, ist das Mitteln über mehrere Instanzen derselben Klasse. Das kann Rauschen entfernen und zugrunde liegende Muster sichtbar machen (oder auch nicht).
In dieser Übung bildest du den Mittelwert über viele Instanzen jeder Klasse von Herzschlagtönen.
Die beiden DataFrames (normal und abnormal) sowie das Zeitarray (time) aus der vorherigen Übung stehen dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Maschinelles Lernen für Zeitreihendaten in Python
Anleitung zur Übung
- Bilde den Mittelwert über die Audiodateien in
normalundabnormal, wobei die Zeitdimension erhalten bleibt. - Visualisiere diese Mittelwerte über die Zeit.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)
# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()