Inspection des données de classification
Dans ces derniers exercices du chapitre, vous allez explorer les deux jeux de données utilisés dans ce cours.
Le premier est une collection d’enregistrements de battements cardiaques. En temps normal, le cœur produit un motif sonore prévisible, mais certains troubles peuvent entraîner des battements anormaux. Ce jeu de données contient un ensemble de données d’entraînement avec des étiquettes pour chaque type de battement, et un ensemble de test sans étiquettes. Vous utiliserez l’ensemble de test pour valider vos modèles.
Comme vous disposez de données étiquetées, ce jeu se prête bien à la classification. D’ailleurs, il a été proposé à l’origine dans le cadre d’une compétition publique Kaggle.
Cet exercice fait partie du cours
Machine Learning for Time Series Data in Python
Instructions
- Utilisez
globpour obtenir la liste des fichiers.wavdans le répertoiredata_dir. - Importez le premier fichier audio de la liste avec
librosa. - Générez un tableau
timepour les données. - Tracez la forme d’onde de ce fichier avec le tableau de temps.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import librosa as lr
from glob import glob
# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')
# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____
# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()