Inspeção dos dados de classificação
Nos exercícios finais deste capítulo, você explorará os dois conjuntos de dados que usará neste curso.
O primeiro é uma coleção de sons de batimentos cardíacos. Normalmente, o coração tem um padrão de som previsível quando bate, mas alguns distúrbios podem fazer com que o coração bata de forma anormal. Esse conjunto de dados contém um conjunto de treinamento com rótulos para cada tipo de batimento cardíaco e um conjunto de teste sem rótulos. Você usará o conjunto de testes para validar seus modelos.
Como você tem dados rotulados, esse conjunto de dados é ideal para classificação. Na verdade, ele foi originalmente oferecido como parte de uma competição pública da Kaggle.
Este exercício faz parte do curso
Aprendizado de máquina para dados de séries temporais em Python
Instruções de exercício
- Use
glob
para retornar uma lista dos arquivos.wav
no diretóriodata_dir
. - Importe o primeiro arquivo de áudio da lista usando
librosa
. - Gerar uma matriz
time
para os dados. - Trace a forma de onda para esse arquivo, junto com a matriz de tempo.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
import librosa as lr
from glob import glob
# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')
# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____
# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()