Ses veri kümelerini ön işleme

Çiftçilerin makinelerini sesli komutlarla kontrol etmesini sağlayarak hassas tarım uygulamanı geliştiriyorsun. Sistem, "Yağmurlama sulama sistemini aç." gibi komutlardaki anahtar kelimeleri tanımalı.

"on" gibi anahtar kelimelerin ses kliplerinden oluşan bir keyword spotting veri kümesinden yararlanacaksın. Ses dosyalarını, önceden eğitilmiş bir Transformer modelinde kullanılabilecek şekilde ön işle!

Bazı veriler önceden yüklendi:

dataset, ses dosyalarından oluşan örnek bir eğitim veri kümesini içerir. Zaten train bölümü var, bu yüzden dataset kullanırken train belirtmene gerek yok.
AutoFeatureExtractor, transformers içinden içe aktarıldı.
model, facebook/wav2vec2-base değerine eşittir.
max_duration 1 saniye olarak tanımlandı.

Bu egzersiz, kursun bir parçasıdır

PyTorch ile Verimli AI Model Eğitimi

Kursa Göz Atın

Egzersiz talimatları

AutoFeatureExtractor sınıfıyla önceden eğitilmiş bir feature_extractor yükle.
sampling_rate değerini feature_extractor içindeki oranları kullanarak ayarla.
audio_arrays için max_length değerini max_duration kullanarak ayarla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Load a pre-trained feature extractor
feature_extractor = ____.____(model)

def preprocess_function(examples):
    audio_arrays = [x["array"] for x in examples["audio"]]
    inputs = feature_extractor(
        audio_arrays,
        # Set the sampling rate
        sampling_rate=____.____, 
        # Set the max length
        max_length=int(feature_extractor.sampling_rate * max_duration), 
        truncation=True)
    return inputs

encoded_dataset = dataset.map(preprocess_function, remove_columns=["audio", "file"], batched=True)

Kodu Düzenle ve Çalıştır