or
Latihan ini merupakan bagian dari kursus
Berkas audio berbeda dengan sebagian besar jenis data lainnya. Sebelum dapat digunakan, berkas tersebut memerlukan prapemrosesan. Di bab ini, Anda akan mempelajari langkah awal bekerja dengan berkas ujaran dengan mengonversi dua berkas audio berbeda menjadi gelombang suara dan membandingkannya secara visual.
Pengenalan ujaran masih jauh dari sempurna. Namun pustaka SpeechRecognition menyediakan cara mudah untuk berinteraksi dengan banyak API speech-to-text. Di bagian ini, Anda akan mempelajari cara menggunakan pustaka SpeechRecognition untuk mulai mengonversi bahasa lisan dalam berkas audio Anda menjadi teks dengan mudah.
Tidak semua berkas audio memiliki bentuk, ukuran, atau format yang sama. Untungnya, pustaka PyDub oleh James Robert menyediakan alat yang dapat Anda gunakan untuk secara terprogram mengubah berbagai atribut berkas audio seperti laju bingkai, jumlah kanal, format berkas, dan lainnya. Di bab ini, Anda akan mempelajari cara menggunakan pustaka yang membantu ini untuk memastikan semua berkas audio Anda berada dalam kondisi yang tepat untuk ditranskripsi.
Di bab ini, Anda akan menggabungkan semua yang telah dipelajari dengan membangun proyek bukti konsep pemrosesan ujaran untuk sebuah perusahaan teknologi, Acme Studios. Anda akan mulai dengan mentranskripsi cuplikan audio panggilan dukungan pelanggan menjadi teks. Lalu Anda akan melakukan analisis sentimen menggunakan NLTK, pengenalan entitas bernama menggunakan spaCy, dan klasifikasi teks menggunakan scikit-learn pada teks hasil transkripsi.
Latihan Saat Ini