Telefoongesprekken transcriberen
In deze oefening transcriberen we de audiobestanden die we naar .wav-formaat hebben omgezet naar tekst met transcribe_audio().
Omdat het er veel zijn en het er nog meer kunnen worden, bouwen we een functie create_test_list() die een lijst met bestandsnamen van audiobestanden als input neemt en elk bestand langsloopt om de tekst te transcriberen.
create_test_list() gebruikt onze eerder gemaakte functie transcribe_audio() en geeft een lijst met strings terug met de getranscribeerde tekst uit elk audiobestand.
pre_purchase_wav_files en post_purchase_wav_files zijn lijsten met bestandsnamen van audiosnippets.
Deze oefening maakt deel uit van de cursus
Spoken Language Processing in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
def create_text_list(folder):
# Create empty list
text_list = []
# Go through each file
for file in folder:
# Make sure the file is .wav
if file.endswith(".wav"):
print(f"Transcribing file: {file}...")
# Transcribe audio and append text to list
text_list.append(____(file))
return ____
create_text_list(folder)