Ses veri kümelerini ön işleme
Çiftçilerin makinelerini sesli komutlarla kontrol etmesini sağlayarak hassas tarım uygulamanı geliştiriyorsun. Sistem, "Yağmurlama sulama sistemini aç." gibi komutlardaki anahtar kelimeleri tanımalı.
"on" gibi anahtar kelimelerin ses kliplerinden oluşan bir keyword spotting veri kümesinden yararlanacaksın. Ses dosyalarını, önceden eğitilmiş bir Transformer modelinde kullanılabilecek şekilde ön işle!
Bazı veriler önceden yüklendi:
dataset, ses dosyalarından oluşan örnek bir eğitim veri kümesini içerir. Zatentrainbölümü var, bu yüzdendatasetkullanırkentrainbelirtmene gerek yok.AutoFeatureExtractor,transformersiçinden içe aktarıldı.model,facebook/wav2vec2-basedeğerine eşittir.max_duration1 saniye olarak tanımlandı.
Bu egzersiz, kursun bir parçasıdır
PyTorch ile Verimli AI Model Eğitimi
Egzersiz talimatları
AutoFeatureExtractorsınıfıyla önceden eğitilmiş birfeature_extractoryükle.sampling_ratedeğerinifeature_extractoriçindeki oranları kullanarak ayarla.audio_arraysiçinmax_lengthdeğerinimax_durationkullanarak ayarla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Load a pre-trained feature extractor
feature_extractor = ____.____(model)
def preprocess_function(examples):
audio_arrays = [x["array"] for x in examples["audio"]]
inputs = feature_extractor(
audio_arrays,
# Set the sampling rate
sampling_rate=____.____,
# Set the max length
max_length=int(feature_extractor.sampling_rate * max_duration),
truncation=True)
return inputs
encoded_dataset = dataset.map(preprocess_function, remove_columns=["audio", "file"], batched=True)