1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zpracování mluveného jazyka v Pythonu

Connected

cvičení

Rozdělení stereo audia na mono pomocí PyDub

Pokud chceš přepisovat telefonní hovory, je velká šance, že jsou nahrané ve stereo formátu – každý mluvčí na samostatném kanálu.

Jak už víš, přepis zvukového souboru s více mluvčími bývá problematický. Jedno z řešení je rozdělit takový soubor na samostatné soubory pro každého mluvčího zvlášť.

S tím ti pomůže funkce split_to_mono() z knihovny PyDub. Když ji zavoláš na stereo AudioSegment, vrátí seznam dvou samostatných AudioSegment v mono formátu – jeden pro každý kanál.

V tomto cvičení si to vyzkoušíš: rozdělíš nahrávku stereo telefonního hovoru (stereo_phone_call.wav) na kanál 1 a kanál 2. Tím od sebe oddělíš oba mluvčí a přepis bude mnohem snazší.

Pokyny

100 XP
  • Importuj AudioSegment z pydub.
  • Vytvoř instanci AudioSegment s názvem stereo_phone_call ze souboru stereo_phone_call.wav.
  • Rozděl stereo_phone_call na channels pomocí split_to_mono() a zkontroluj kanály výsledného výstupu.
  • Ulož každý kanál do nové proměnné: phone_call_channel_1 a phone_call_channel_2.