Audiobestanden voorbereiden voor tekstclassificatie
Acme is erg onder de indruk van je werk tot nu toe. Daarom hebben ze twee extra mappen met audiobestanden gestuurd.
Eén map heet pre_purchase en bevat audiosnippets van klanten vóór aankoop, zoals pre_purchase_audio_25.mp3 (bestand).
De andere heet post_purchase en bevat audiosnippets van klanten die al een aankoop hebben gedaan (na aankoop), zoals post_purchase_audio_27.mp3 (bestand).
Als je de bestanden bekijkt, zie je dat er ongeveer 50 in elke map staan en dat ze in het .mp3-formaat zijn.
Acme wil weten of je een classifier kunt bouwen om toekomstige gesprekken te classificeren. Je laat weten dat dat zeker kan.
In deze oefening ga je daarom elke map langs en zet je de audiobestanden om naar het .wav-formaat met convert_to_wav(), zodat je ze kunt transcriberen.
Deze oefening maakt deel uit van de cursus
Spoken Language Processing in Python
Oefeninstructies
- Converteer de bestanden in
pre_purchasenaar.wavmetconvert_to_wav(). - Converteer de bestanden in
post_purchasenaar.wavmetconvert_to_wav().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Convert post purchase
for file in post_purchase:
print(f"Converting {file} to .wav...")
convert_to_wav(____)
# Convert pre purchase
for file in ____:
print(f"Converting {file} to .wav...")
____(file)