Sınıflandırma verisini inceleme
Bu bölümün son egzersizlerinde, bu kursta kullanacağın iki veri kümesini keşfedeceksin.
İlki bir kalp atışı sesleri koleksiyonu. Kalpler normalde atarken öngörülebilir bir ses düzenine sahiptir, ancak bazı rahatsızlıklar kalbin anormal atmasına neden olabilir. Bu veri kümesi, her kalp atışı türü için etiketlerin bulunduğu bir eğitim seti ve etiketlerin olmadığı bir test seti içerir. Modellerini doğrulamak için test setini kullanacaksın.
Etiketli veriye sahip olduğun için, bu veri kümesi sınıflandırma için idealdir. Nitekim, başlangıçta halka açık bir Kaggle yarışmasının parçası olarak sunulmuştur.
Bu egzersiz, kursun bir parçasıdır
Python ile Zaman Serisi Verileri için Machine Learning
Egzersiz talimatları
globkullanarakdata_dirdizinindeki.wavdosyalarının bir listesini döndür.- Listedeki ilk ses dosyasını
librosaile içe aktar. - Veri için bir
timedizisi oluştur. - Bu dosyanın dalga formunu, zaman dizisiyle birlikte görselleştir.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
import librosa as lr
from glob import glob
# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')
# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____
# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()