1. 학습
  2. /
  3. 강의
  4. /
  5. Hugging Face로 배우는 멀티모달 모델

Connected

연습 문제

비디오 오디오 분리

이 연습 문제에서는 1980년대 Bounce 섬유 유연제 광고 영상을 분할해 보겠습니다. 이렇게 분리해야 이미지 분류 모델과 오디오 분류 모델에 각각 필요한 이미지 입력과 오디오 입력을 따로 준비할 수 있어요.

Frames from the Bounce TV commercial

ffmpeg_extract_subclip과 VideoFileClip 모듈은 로드되어 있습니다. MP4 파일은 bounce_ad.mp4로 다운로드되어 있어요.

지침

100 XP
  • bounce_ad.mp4에서 0초부터 5초까지의 구간을 잘라 bounce_ad_5s.mp4라는 파일로 저장하세요.
  • 새로 만든 서브클립을 로드하세요.
  • 오디오 스트림을 추출하세요.
  • 오디오 스트림을 bounce_ad_5s.mp3 파일명으로 저장하세요.