1. 학습
  2. /
  3. 강의
  4. /
  5. Hugging Face로 배우는 멀티모달 모델

Connected

연습 문제

텍스트 토크나이징

이 연습 문제에서는 30,000장의 이미지와 캡션이 연결된 flickr 데이터셋을 사용해 텍스트 전처리를 수행해 보겠습니다. 전처리는 텍스트 분류와 같은 작업에 모델을 활용하기 위해 꼭 필요합니다. 특히 멀티모달 애플리케이션에서, Hugging Face 모델을 사용해 이미지와 연결된 캡션의 적합성을 확인할 때 유용합니다.

데이터셋(dataset)은 이미 로드되어 있으며 AutoTokenizer도 임포트되어 있습니다.

지침 1/2

undefined XP
    1
    2
  • dataset의 인덱스 5에 있는 이미지에서 첫 번째 "caption"을 로드하세요.