Nhiều người nói 1

Nếu mục tiêu của bạn là phiên âm các cuộc hội thoại, sẽ có nhiều hơn một người nói. Tuy nhiên, như bạn sẽ thấy, hàm recognize_google() chỉ phiên âm lời nói thành một khối văn bản duy nhất.

Bạn có thể nghe trong tệp âm thanh này có ba người nói khác nhau.

Nhưng nếu bạn phiên âm trực tiếp, recognize_google() sẽ trả về một khối văn bản duy nhất. Điều này vẫn hữu ích nhưng không cho bạn biết ai nói câu nào.

Chúng ta sẽ xem một cách làm khác trong bài tập tiếp theo.

Tệp âm thanh nhiều người nói đã được nhập và chuyển đổi thành AudioData với tên multiple_speakers.

Tạo một thể hiện của Recognizer.
Nhận dạng biến multiple_speakers bằng hàm recognize_google().
Đặt ngôn ngữ là tiếng Anh Mỹ ("en-US").

Bài tập

Nhiều người nói 1

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập