Rozdělení stereo audia na mono pomocí PyDub

Pokud chceš přepisovat telefonní hovory, je velká šance, že jsou nahrané ve stereo formátu – každý mluvčí na samostatném kanálu.

Jak už víš, přepis zvukového souboru s více mluvčími bývá problematický. Jedno z řešení je rozdělit takový soubor na samostatné soubory pro každého mluvčího zvlášť.

S tím ti pomůže funkce split_to_mono() z knihovny PyDub. Když ji zavoláš na stereo AudioSegment, vrátí seznam dvou samostatných AudioSegment v mono formátu – jeden pro každý kanál.

V tomto cvičení si to vyzkoušíš: rozdělíš nahrávku stereo telefonního hovoru (stereo_phone_call.wav) na kanál 1 a kanál 2. Tím od sebe oddělíš oba mluvčí a přepis bude mnohem snazší.

Importuj AudioSegment z pydub.
Vytvoř instanci AudioSegment s názvem stereo_phone_call ze souboru stereo_phone_call.wav.
Rozděl stereo_phone_call na channels pomocí split_to_mono() a zkontroluj kanály výsledného výstupu.
Ulož každý kanál do nové proměnné: phone_call_channel_1 a phone_call_channel_2.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení