1. Învăţa
  2. /
  3. Courses
  4. /
  5. Intermediate Deep Learning with PyTorch

Connected

exercise

PyTorch 데이터셋

PyTorch 데이터셋 지식을 다시 한 번 되살려 볼까요?

모델 학습을 시작하려면 데이터를 올바른 형식으로 로드해 모델에 전달해야 해요. PyTorch에서는 이 작업을 Dataset과 DataLoader가 담당합니다. 우선 수질 적합성(water potability) 데이터를 위한 PyTorch Dataset을 만들어 보겠습니다.

이번 연습에서는 CSV 파일에서 데이터를 로드하는 WaterDataset 클래스를 정의할 거예요. 이를 위해 PyTorch의 Dataset이 가져야 하는 세 가지 메서드를 구현해야 합니다:

  • 데이터를 로드하는 .__init__()
  • 데이터 크기를 반환하는 .__len__()
  • 단일 샘플의 특징과 레이블을 추출하는 .__getitem()__

필요한 임포트는 이미 준비되어 있습니다:

import pandas as pd
from torch.utils.data import Dataset

Instrucțiuni 1 / 3

undefined XP
    1
    2
    3
  • .__init__() 메서드에서 csv_path의 데이터를 pandas DataFrame으로 로드하고 df에 할당하세요.
  • df를 NumPy 배열로 변환해 결과를 self.data에 할당하세요.