Invarianz in der Zeit

Auch wenn du immer damit beginnen solltest, deine Rohdaten zu visualisieren, ist das oft wenig hilfreich, wenn es darum geht, zwischen zwei Klassen von Datenpunkten zu unterscheiden. Daten sind meist verrauscht oder zeigen komplexe Muster, die man mit bloßem Auge nicht erkennt.

Eine weitere gängige Technik, um einfache Unterschiede zwischen zwei Datensätzen zu finden, ist das Mitteln über mehrere Instanzen derselben Klasse. Das kann Rauschen entfernen und zugrunde liegende Muster sichtbar machen (oder auch nicht).

In dieser Übung bildest du den Mittelwert über viele Instanzen jeder Klasse von Herzschlagtönen.

Die beiden DataFrames (normal und abnormal) sowie das Zeitarray (time) aus der vorherigen Übung stehen dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

Maschinelles Lernen für Zeitreihendaten in Python

Kurs anzeigen

Anleitung zur Übung

Bilde den Mittelwert über die Audiodateien in normal und abnormal, wobei die Zeitdimension erhalten bleibt.
Visualisiere diese Mittelwerte über die Zeit.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Average across the audio files of each DataFrame
mean_normal = np.mean(normal, axis=____)
mean_abnormal = np.mean(abnormal, axis=____)

# Plot each average over time
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3), sharey=True)
ax1.plot(____, ____)
ax1.set(title="Normal Data")
ax2.plot(____, ____)
ax2.set(title="Abnormal Data")
plt.show()

Code bearbeiten und ausführen