PyDub ile bir ses dosyasını normalleştirme
Bazen konuşmanın bazı kısımları yüksek, bazı kısımları ise düşük sesli olan ses dosyaların olabilir. Bu ses yüksekliği farklılıkları, yazıya dökme sürecini zorlaştırabilir.
Neyse ki PyDub'un effects modülünde normalize() adında bir fonksiyon var. Bu fonksiyon bir AudioSegmentin maksimum ses seviyesini bulur, sonra geri kalanını buna orantılı olacak şekilde ayarlar. Yani sessiz kısımlar bir miktar ses artışı alır.
Başta yüksek sesle başlayıp sonra kısılan bir ses dosyası örneğini, loud_then_quiet.wav, buradan dinleyebilirsin.
Bu egzersizde, dosyamızın ses seviyesini normalize() ile normalleştirip buna daha çok benzeyecek şekilde ayarlayacaksın.
Bu egzersiz
Python ile Konuşma Dili İşleme
kursunun bir parçasıdırEgzersiz talimatları
PyDubiçindenAudioSegmenti vePyDubun effects modülündennormalizeı içe aktar.- Hedef ses dosyasını,
loud_then_quiet.wavdosyasını içe aktar veloud_then_quietdeğişkenine kaydet. - İçe aktardığın ses dosyasını
normalize()fonksiyonunu kullanarak normalleştir venormalized_loud_then_quietdeğişkenine kaydet.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____
# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)
# Normalize target audio file
normalized_loud_then_quiet = ____(____)