1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zpracování mluveného jazyka v Pythonu

Connected

cvičení

Normalizace zvukového souboru pomocí PyDub

Někdy narazíš na zvukové soubory, kde je řeč na některých místech hlasitá a na jiných tichá. Taková nerovnoměrná hlasitost může ztížit přepis.

Naštěstí má modul effects v PyDub funkci normalize(), která najde maximální hlasitost AudioSegment a podle ní upraví zbytek záznamu. Tiché části tak dostanou hlasitostní boost.

Ukázku zvukového souboru, který začíná hlasitě a postupně ztichne – loud_then_quiet.wav – si můžeš poslechnout zde.

V tomto cvičení použiješ normalize() k vyrovnání hlasitosti souboru, takže bude znít přibližně takto.

Pokyny

100 XP
  • Importuj AudioSegment z PyDub a normalize z modulu effects knihovny PyDub.
  • Načti cílový zvukový soubor loud_then_quiet.wav a ulož ho do proměnné loud_then_quiet.
  • Normalizuj načtený zvukový soubor pomocí funkce normalize() a výsledek ulož do normalized_loud_then_quiet.