Klassifikationsdaten untersuchen

In diesen letzten Übungen dieses Kapitels erkundest du die zwei Datensätze, die du in diesem Kurs verwenden wirst.

Der erste ist eine Sammlung von Herzschlaggeräuschen. Gesunde Herzen haben beim Schlagen ein vorhersehbares Klangmuster, aber einige Störungen können dazu führen, dass das Herz unregelmäßig schlägt. Dieser Datensatz enthält einen Training-Satz mit Labels für jeden Herzschlagtyp und einen Test-Satz ohne Labels. Du wirst den Test-Satz verwenden, um deine Modelle zu validieren.

Da du gelabelte Daten hast, eignet sich dieser Datensatz ideal für Klassifikation. Tatsächlich wurde er ursprünglich im Rahmen eines öffentlichen Kaggle-Wettbewerbs angeboten.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen für Zeitreihendaten in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Verwende glob, um eine Liste der .wav-Dateien im Verzeichnis data_dir zurückzugeben.
Importiere die erste Audiodatei in der Liste mit librosa.
Erzeuge ein time-Array für die Daten.
Zeichne die Wellenform dieser Datei zusammen mit dem Zeitarray.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

import librosa as lr
from glob import glob

# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')

# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____

# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()

Code bearbeiten und ausführen