1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zpracování mluveného jazyka v Pythonu

Connected

Cvičení

Více mluvčích 2

Rozlišování více mluvčích v jednom zvukovém souboru se označuje jako diarizace. Funkce recognize_google(), kterou jsme zatím používali, ale různé mluvčí bohužel nedokáže rozlišit.

Jednou z možností, jak se bez placených služeb pro převod řeči na text obejít, je zajistit, aby každý zvukový soubor obsahoval hlas pouze jednoho mluvčího.

Pokud bys například pracoval/a s nahrávkami telefonních hovorů, nahrával/a bys volajícího a příjemce zvlášť – a každý soubor bys pak mohl/a přepsat samostatně.

V tomto cvičení přepíšeme každého mluvčího z našeho zvukového souboru s více mluvčími zvlášť.

Pokyny

100 XP
  • Předej speakers funkci enumerate() a procházej jednotlivé mluvčí ve smyčce.
  • Zavolej record() na objektu recognizer, aby se soubory AudioFile převedly na AudioData.
  • Pomocí recognize_google() přepiš každý objekt speaker_audio.