Normalizace zvukového souboru pomocí PyDub

Někdy narazíš na zvukové soubory, kde je řeč na některých místech hlasitá a na jiných tichá. Taková nerovnoměrná hlasitost může ztížit přepis.

Naštěstí má modul effects v PyDub funkci normalize(), která najde maximální hlasitost AudioSegment a podle ní upraví zbytek záznamu. Tiché části tak dostanou hlasitostní boost.

Ukázku zvukového souboru, který začíná hlasitě a postupně ztichne – loud_then_quiet.wav – si můžeš poslechnout zde.

V tomto cvičení použiješ normalize() k vyrovnání hlasitosti souboru, takže bude znít přibližně takto.

Importuj AudioSegment z PyDub a normalize z modulu effects knihovny PyDub.
Načti cílový zvukový soubor loud_then_quiet.wav a ulož ho do proměnné loud_then_quiet.
Normalizuj načtený zvukový soubor pomocí funkce normalize() a výsledek ulož do normalized_loud_then_quiet.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení