Een audiobestand normaliseren met PyDub

Soms heb je audiobestanden waarin de spraak op sommige stukken hard is en op andere juist zacht. Die variatie in volume kan het transcriberen lastiger maken.

Gelukkig heeft de effects-module van PyDub een functie normalize() die het maximale volume van een AudioSegment bepaalt en de rest van het AudioSegment daarop afstemt. Zo krijgen de zachte delen een volumeboost.

Je kunt hier luisteren naar een voorbeeld van een audiobestand dat hard begint en daarna zachter wordt, loud_then_quiet.wav, hier.

In deze oefening gebruik je normalize() om het volume van ons bestand te normaliseren, zodat het meer zo klinkt.

Deze oefening maakt deel uit van de cursus

Spoken Language Processing in Python

Bekijk cursus

Oefeninstructies

Importeer AudioSegment uit PyDub en normalize uit de effects-module van PyDub.
Importeer het doel-audiobestand, loud_then_quiet.wav, en sla het op in loud_then_quiet.
Normaliseer het geïmporteerde audiobestand met de functie normalize() en sla het op in normalized_loud_then_quiet.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____

# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)

# Normalize target audio file
normalized_loud_then_quiet = ____(____)

Code bewerken en uitvoeren