Klassifikationsdaten untersuchen
In diesen letzten Übungen dieses Kapitels erkundest du die zwei Datensätze, die du in diesem Kurs verwenden wirst.
Der erste ist eine Sammlung von Herzschlaggeräuschen. Gesunde Herzen haben beim Schlagen ein vorhersehbares Klangmuster, aber einige Störungen können dazu führen, dass das Herz unregelmäßig schlägt. Dieser Datensatz enthält einen Training-Satz mit Labels für jeden Herzschlagtyp und einen Test-Satz ohne Labels. Du wirst den Test-Satz verwenden, um deine Modelle zu validieren.
Da du gelabelte Daten hast, eignet sich dieser Datensatz ideal für Klassifikation. Tatsächlich wurde er ursprünglich im Rahmen eines öffentlichen Kaggle-Wettbewerbs angeboten.
Diese Übung ist Teil des Kurses
Maschinelles Lernen für Zeitreihendaten in Python
Anleitung zur Übung
- Verwende
glob, um eine Liste der.wav-Dateien im Verzeichnisdata_dirzurückzugeben. - Importiere die erste Audiodatei in der Liste mit
librosa. - Erzeuge ein
time-Array für die Daten. - Zeichne die Wellenform dieser Datei zusammen mit dem Zeitarray.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
import librosa as lr
from glob import glob
# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')
# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____
# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()