1. Learn
  2. /
  3. Courses
  4. /
  5. Hugging Face で学ぶマルチモーダルモデル

Connected

Exercise

動画の音声分離

この演習では、1980年代の Bounce 柔軟剤のテレビCM動画を分割します。画像モデルと音声モデルをそれぞれ動かすために、入力として使う映像と音声を分離しておく必要があるためです。

Frames from the Bounce TV commercial

ffmpeg_extract_subclip と VideoFileClip モジュールは読み込まれています。MP4 ファイルは bounce_ad.mp4 としてダウンロード済みです。

Instructions

100 XP
  • bounce_ad.mp4 から、開始 0 秒・終了 5 秒のサブクリップを作成し、出力ファイル名を bounce_ad_5s.mp4 にします。
  • 新しいサブクリップを読み込みます。
  • 音声ストリームを抽出します。
  • 音声ストリームを bounce_ad_5s.mp3 というファイル名で書き出します。