Inspeccionar los datos de clasificación
En estos últimos ejercicios del capítulo, vas a explorar los dos conjuntos de datos que usarás en este curso.
El primero es una colección de sonidos de latidos del corazón. Un corazón sano suele tener un patrón de sonido predecible, pero algunos trastornos pueden hacer que lata de forma anormal. Este conjunto de datos incluye un conjunto de entrenamiento con etiquetas para cada tipo de latido y un conjunto de prueba sin etiquetas. Usarás el conjunto de prueba para validar tus modelos.
Como dispones de datos etiquetados, este conjunto es ideal para clasificación. De hecho, se ofreció originalmente como parte de una competición pública de Kaggle.
Este ejercicio forma parte del curso
Machine Learning para datos de series temporales en Python
Instrucciones del ejercicio
- Usa
globpara devolver una lista de los archivos.waven el directoriodata_dir. - Importa el primer archivo de audio de la lista usando
librosa. - Genera un array
timepara los datos. - Representa la forma de onda de este archivo junto con el array de tiempo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
import librosa as lr
from glob import glob
# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')
# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____
# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()