Audiobestanden voorbereiden voor tekstclassificatie

Acme is erg onder de indruk van je werk tot nu toe. Daarom hebben ze twee extra mappen met audiobestanden gestuurd.

Eén map heet pre_purchase en bevat audiosnippets van klanten vóór aankoop, zoals pre_purchase_audio_25.mp3 (bestand).

De andere heet post_purchase en bevat audiosnippets van klanten die al een aankoop hebben gedaan (na aankoop), zoals post_purchase_audio_27.mp3 (bestand).

Als je de bestanden bekijkt, zie je dat er ongeveer 50 in elke map staan en dat ze in het .mp3-formaat zijn.

Acme wil weten of je een classifier kunt bouwen om toekomstige gesprekken te classificeren. Je laat weten dat dat zeker kan.

In deze oefening ga je daarom elke map langs en zet je de audiobestanden om naar het .wav-formaat met convert_to_wav(), zodat je ze kunt transcriberen.

Deze oefening maakt deel uit van de cursus

Spoken Language Processing in Python

Bekijk cursus

Oefeninstructies

Converteer de bestanden in pre_purchase naar .wav met convert_to_wav().
Converteer de bestanden in post_purchase naar .wav met convert_to_wav().

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Convert post purchase
for file in post_purchase:
    print(f"Converting {file} to .wav...")
    convert_to_wav(____)

# Convert pre purchase
for file in ____:
    print(f"Converting {file} to .wav...")
    ____(file)

Code bewerken en uitvoeren