BaşlayınÜcretsiz başlayın

Birden Fazla Konuşmacı 1

Amacın konuşmaları yazıya dökmekse, birden fazla konuşmacı olacaktır. Ancak göreceğin gibi, recognize_google() fonksiyonu konuşmayı tek bir metin bloğu olarak döker.

Bu ses dosyasında üç farklı konuşmacı olduğunu duyabilirsin.

Ama ses dosyasını tek başına yazıya dökersen, recognize_google() tek bir metin bloğu döndürür. Bu hâlâ faydalıdır ama hangi cümleyi kimin söylediğini bilemezsin.

Bunun alternatifini bir sonraki egzersizde göreceğiz.

Birden fazla konuşmacı içeren ses dosyası içe aktarıldı ve AudioData tipine çevrilerek multiple_speakers olarak kaydedildi.

Bu egzersiz, kursun bir parçasıdır

Python ile Konuşma Dili İşleme

Kursa Göz Atın

Egzersiz talimatları

  • Recognizer sınıfından bir örnek oluştur.
  • recognize_google() fonksiyonunu kullanarak multiple_speakers değişkenini tanı.
  • Dili ABD İngilizcesi ("en-US") olarak ayarla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create a recognizer class
recognizer = sr.____()

# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____, 
                       			   language=____)

# Print the text
print(text)
Kodu Düzenle ve Çalıştır