Inspection des données de classification

Dans ces derniers exercices du chapitre, vous allez explorer les deux jeux de données utilisés dans ce cours.

Le premier est une collection d’enregistrements de battements cardiaques. En temps normal, le cœur produit un motif sonore prévisible, mais certains troubles peuvent entraîner des battements anormaux. Ce jeu de données contient un ensemble de données d’entraînement avec des étiquettes pour chaque type de battement, et un ensemble de test sans étiquettes. Vous utiliserez l’ensemble de test pour valider vos modèles.

Comme vous disposez de données étiquetées, ce jeu se prête bien à la classification. D’ailleurs, il a été proposé à l’origine dans le cadre d’une compétition publique Kaggle.

Cet exercice fait partie du cours

<cours>Machine Learning for Time Series Data in Python</cours>

Voir le cours

Instructions de l’exercice

Utilisez glob pour obtenir la liste des fichiers .wav dans le répertoire data_dir.
Importez le premier fichier audio de la liste avec librosa.
Générez un tableau time pour les données.
Tracez la forme d’onde de ce fichier avec le tableau de temps.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

import librosa as lr
from glob import glob

# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')

# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____

# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()

Modifier et exécuter le code