1. 학습
  2. /
  3. 강의
  4. /
  5. Hugging Face로 배우는 멀티모달 모델

Connected

연습 문제

CV 파인튜닝: 데이터세트 준비

이 연습에서는 학습을 위해 Stanford Cars 데이터세트를 준비해 보겠습니다. 이를 위해 datasets 라이브러리로 데이터세트를 분할하고 전처리 변환을 적용합니다. 이 데이터세트는 196개 자동차 모델에 대한 라벨이 있는 8천 장의 이미지로 구성되어 있습니다:

an example car from the dataset

데이터세트는 dataset으로 로드되어 있습니다. 변환은 transforms로 미리 정의되어 있으며, 재정규화와 타입 변환으로 이루어져 있습니다.

지침

100 XP
  • .train_test_split() 메서드를 사용해 dataset에서 80/20 학습/테스트 분할을 만드세요.
  • 변환(transforms)을 data_splits에 적용하세요.
  • dataset_transformed에서 첫 번째 픽셀 값 집합으로부터 생성된 증강 이미지를 시각화하세요.