Podział audio stereo na mono za pomocą PyDub

Jeśli chcesz transkrybować rozmowy telefoniczne, istnieje spora szansa, że zostały nagrane w formacie stereo – z jednym mówcą na każdym kanale.

Jak już wiesz, transkrypcja pliku audio z więcej niż jednym mówcą jest trudna. Jednym z rozwiązań jest podzielenie takiego pliku na osobne pliki – po jednym dla każdego mówcy.

Funkcja split_to_mono() z biblioteki PyDub świetnie się do tego nadaje. Wywołana na AudioSegment nagranym w stereo, zwraca listę dwóch oddzielnych AudioSegment'ów w formacie mono – po jednym na każdy kanał.

W tym ćwiczeniu przećwiczysz to, dzieląc to nagranie stereofonicznej rozmowy telefonicznej (stereo_phone_call.wav) na kanał 1 i kanał 2. Dzięki temu rozdzielisz obu rozmówców, co znacznie ułatwi transkrypcję.

Zaimportuj AudioSegment z pydub.
Utwórz instancję AudioSegment o nazwie stereo_phone_call na podstawie pliku stereo_phone_call.wav.
Podziel stereo_phone_call na kanały (channels), używając split_to_mono(), i sprawdź kanały zwróconego wyniku.
Zapisz każdy kanał do nowych zmiennych: phone_call_channel_1 i phone_call_channel_2.

अभ्यास

Podział audio stereo na mono za pomocą PyDub

निर्देश

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}अभ्यास

निर्देश

अभ्यास