Een audiobestand normaliseren met PyDub
Soms heb je audiobestanden waarin de spraak op sommige stukken hard is en op andere juist zacht. Die variatie in volume kan het transcriberen lastiger maken.
Gelukkig heeft de effects-module van PyDub een functie normalize() die het maximale volume van een AudioSegment bepaalt en de rest van het AudioSegment daarop afstemt. Zo krijgen de zachte delen een volumeboost.
Je kunt hier luisteren naar een voorbeeld van een audiobestand dat hard begint en daarna zachter wordt, loud_then_quiet.wav, hier.
In deze oefening gebruik je normalize() om het volume van ons bestand te normaliseren, zodat het meer zo klinkt.
Deze oefening maakt deel uit van de cursus
Spoken Language Processing in Python
Oefeninstructies
- Importeer
AudioSegmentuitPyDubennormalizeuit de effects-module vanPyDub. - Importeer het doel-audiobestand,
loud_then_quiet.wav, en sla het op inloud_then_quiet. - Normaliseer het geïmporteerde audiobestand met de functie
normalize()en sla het op innormalized_loud_then_quiet.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____
# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)
# Normalize target audio file
normalized_loud_then_quiet = ____(____)