1. Leren
  2. /
  3. Cursussen
  4. /
  5. PyTorchによる中級ディープラーニング

Connected

Opdracht

PyTorch Dataset

PyTorch の Dataset について復習しましょう!

モデルの学習を始める前に、データを読み込み、正しい形式でモデルに渡す必要があります。PyTorch では、これを Datasets と DataLoaders が担います。まずは、水の飲用適性データ用の PyTorch Dataset を作成していきます。

この演習では、CSV ファイルからデータを読み込むクラス WaterDataset を定義します。そのために、PyTorch の Dataset に求められる3つのメソッドを実装します。

  • データを読み込む .__init__()、
  • データサイズを返す .__len__()、
  • 単一サンプルの特徴量とラベルを取り出す .__getitem()__。

以下の必要なインポートはすでに用意されています。

import pandas as pd
from torch.utils.data import Dataset

Instructies 1/3

undefined XP
    1
    2
    3
  • .__init__() メソッド内で、csv_path から pandas DataFrame にデータを読み込み、df に代入します。
  • df を NumPy 配列に変換し、結果を self.data に代入します。