1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modele multimodalne z Hugging Face

Connected

ćwiczenie

Wyodrębnianie audio z wideo

W tym ćwiczeniu podzielisz plik wideo z reklamą płynu do płukania tkanin Bounce z lat 80. Jest to niezbędne, aby wyodrębnić obraz i dźwięk potrzebne do zasilenia osobnych modeli klasyfikacji obrazu i audio.

Klatki z reklamy telewizyjnej Bounce

Moduły ffmpeg_extract_subclip i VideoFileClip zostały już załadowane. Plik MP4 jest dostępny pod nazwą bounce_ad.mp4.

Instrukcje

100 XP
  • Utwórz plik klipu z bounce_ad.mp4, który zaczyna się od 0 s i kończy po 5 s, z nazwą pliku wyjściowego bounce_ad_5s.mp4.
  • Załaduj nowy klip.
  • Wyodrębnij strumień audio.
  • Zapisz strumień audio do pliku bounce_ad_5s.mp3.