Sınıflandırma verisini inceleme
Bu bölümün son egzersizlerinde, bu kursta kullanacağın iki veri kümesini keşfedeceksin.
İlki bir kalp atışı sesleri koleksiyonu. Kalpler normalde atarken öngörülebilir bir ses düzenine sahiptir, ancak bazı rahatsızlıklar kalbin anormal atmasına neden olabilir. Bu veri kümesi, her kalp atışı türü için etiketlerin bulunduğu bir eğitim seti ve etiketlerin olmadığı bir test seti içerir. Modellerini doğrulamak için test setini kullanacaksın.
Etiketli veriye sahip olduğun için, bu veri kümesi sınıflandırma için idealdir. Nitekim, başlangıçta halka açık bir Kaggle yarışmasının parçası olarak sunulmuştur.
Bu egzersiz
Python ile Zaman Serisi Verileri için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
globkullanarakdata_dirdizinindeki.wavdosyalarının bir listesini döndür.- Listedeki ilk ses dosyasını
librosaile içe aktar. - Veri için bir
timedizisi oluştur. - Bu dosyanın dalga formunu, zaman dizisiyle birlikte görselleştir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
import librosa as lr
from glob import glob
# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')
# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____
# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()