Birden Fazla Konuşmacı 1
Amacın konuşmaları yazıya dökmekse, birden fazla konuşmacı olacaktır. Ancak göreceğin gibi, recognize_google() fonksiyonu konuşmayı tek bir metin bloğu olarak döker.
Bu ses dosyasında üç farklı konuşmacı olduğunu duyabilirsin.
Ama ses dosyasını tek başına yazıya dökersen, recognize_google() tek bir metin bloğu döndürür. Bu hâlâ faydalıdır ama hangi cümleyi kimin söylediğini bilemezsin.
Bunun alternatifini bir sonraki egzersizde göreceğiz.
Birden fazla konuşmacı içeren ses dosyası içe aktarıldı ve AudioData tipine çevrilerek multiple_speakers olarak kaydedildi.
Bu egzersiz
Python ile Konuşma Dili İşleme
kursunun bir parçasıdırEgzersiz talimatları
Recognizersınıfından bir örnek oluştur.recognize_google()fonksiyonunu kullanarakmultiple_speakersdeğişkenini tanı.- Dili ABD İngilizcesi (
"en-US") olarak ayarla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a recognizer class
recognizer = sr.____()
# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____,
language=____)
# Print the text
print(text)