Sınıflandırma verisini inceleme

Bu bölümün son egzersizlerinde, bu kursta kullanacağın iki veri kümesini keşfedeceksin.

İlki bir kalp atışı sesleri koleksiyonu. Kalpler normalde atarken öngörülebilir bir ses düzenine sahiptir, ancak bazı rahatsızlıklar kalbin anormal atmasına neden olabilir. Bu veri kümesi, her kalp atışı türü için etiketlerin bulunduğu bir eğitim seti ve etiketlerin olmadığı bir test seti içerir. Modellerini doğrulamak için test setini kullanacaksın.

Etiketli veriye sahip olduğun için, bu veri kümesi sınıflandırma için idealdir. Nitekim, başlangıçta halka açık bir Kaggle yarışmasının parçası olarak sunulmuştur.

Bu egzersiz, kursun bir parçasıdır

Python ile Zaman Serisi Verileri için Machine Learning

Kursa Göz Atın

Egzersiz talimatları

glob kullanarak data_dir dizinindeki .wav dosyalarının bir listesini döndür.
Listedeki ilk ses dosyasını librosa ile içe aktar.
Veri için bir time dizisi oluştur.
Bu dosyanın dalga formunu, zaman dizisiyle birlikte görselleştir.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

import librosa as lr
from glob import glob

# List all the wav files in the folder
audio_files = ____(data_dir + '/*.wav')

# Read in the first audio file, create the time array
audio, sfreq = lr.load(____)
time = np.arange(0, len(audio)) / ____

# Plot audio over time
fig, ax = plt.subplots()
ax.plot(____, ____)
ax.set(xlabel='Time (s)', ylabel='Sound Amplitude')
plt.show()

Kodu Düzenle ve Çalıştır