1. 학습
  2. /
  3. 강의
  4. /
  5. Hugging Face로 배우는 멀티모달 모델

Connected

연습 문제

파이프라인으로 캡션 생성

이번 연습 문제에서는 30,000장의 이미지와 캡션이 있는 flickr 데이터셋을 다시 사용해요. 이번에는 auto 클래스 대신 파이프라인을 사용해 아래 이미지의 캡션을 생성해 보겠습니다.

Photo of a man standing on a ladder cleaning a window

데이터셋(dataset)은 아래 구조로 로드되어 있어요:

Dataset({
    features: ['image', 'caption', 'sentids', 'split', 'img_id', 'filename'],
    num_rows: 10
})

파이프라인 모듈(pipeline)이 로드되어 있어요.

지침

100 XP
  • Salesforce/blip-image-captioning-base pretrained 모델로 image-to-text 파이프라인을 로드하세요.
  • 파이프라인을 사용해 인덱스 3의 이미지에 대한 캡션을 생성하세요.