or
Bu egzersiz, kursun bir parçasıdır
Ses dosyaları çoğu veri türünden farklıdır. Onlarla çalışmaya başlamadan önce bir miktar ön işleme gerekir. Bu bölümde, iki farklı ses dosyasını ses dalgalarına dönüştürüp görsel olarak karşılaştırarak konuşma dosyalarıyla çalışmanın ilk adımlarını öğreneceksin.
Konuşma tanıma hâlâ mükemmel olmaktan uzak. Ancak SpeechRecognition kütüphanesi, birçok konuşmadan metne API'siyle kolayca etkileşime geçmeyi sağlar. Bu bölümde, ses dosyalarındaki konuşulan dili zahmetsizce metne çevirmeye başlamak için SpeechRecognition kütüphanesini nasıl kullanacağını öğreneceksin.
Tüm ses dosyaları aynı şekil, boyut veya biçimde gelmez. Neyse ki James Robert'ın PyDub kütüphanesi; örnekleme hızı, kanal sayısı, dosya biçimi ve daha fazlası gibi farklı ses dosyası özelliklerini programlı olarak değiştirmen için araçlar sunar. Bu bölümde, tüm ses dosyalarının yazıya döküm için doğru formda olmasını sağlamak üzere bu kullanışlı kütüphaneyi nasıl kullanacağını öğreneceksin.
Bu bölümde, öğrendiklerinin hepsini bir araya getirerek Acme Studios adlı bir teknoloji şirketi için konuşma işleme odaklı bir kavram kanıtlama projesi geliştireceksin. Önce müşteri destek çağrılarına ait kısa ses parçalarını metne yazıya dökeceksin. Ardından yazıya dökülen metin üzerinde NLTK ile duygu analizi, spaCy ile adlandırılmış varlık tanıma ve scikit-learn ile metin sınıflandırma yapacaksın.
Geçerli egzersiz