LoslegenKostenlos loslegen

Klassifikationsdaten untersuchen

In diesen letzten Übungen dieses Kapitels erkundest du die zwei Datensätze, die du in diesem Kurs verwenden wirst.

Der erste ist eine Sammlung von Herzschlaggeräuschen. Gesunde Herzen haben beim Schlagen ein vorhersehbares Klangmuster, aber einige Störungen können dazu führen, dass das Herz unregelmäßig schlägt. Dieser Datensatz enthält einen Training-Satz mit Labels für jeden Herzschlagtyp und einen Test-Satz ohne Labels. Du wirst den Test-Satz verwenden, um deine Modelle zu validieren.

Da du gelabelte Daten hast, eignet sich dieser Datensatz ideal für Klassifikation. Tatsächlich wurde er ursprünglich im Rahmen eines öffentlichen Kaggle-Wettbewerbs angeboten.

Diese Übung ist Teil des Kurses

Maschinelles Lernen für Zeitreihendaten in Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende glob, um eine Liste der .wav-Dateien im Verzeichnis data_dir zurückzugeben.
  • Importiere die erste Audiodatei in der Liste mit librosa.
  • Erzeuge ein time-Array für die Daten.
  • Zeichne die Wellenform dieser Datei zusammen mit dem Zeitarray.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

import librosa as lr
from glob import glob

# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')

# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____

# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()
Code bearbeiten und ausführen