ComeçarComece gratuitamente

Conjunto de dados do PyTorch

É hora de você atualizar seus conhecimentos sobre os conjuntos de dados do PyTorch!

Antes que o treinamento do modelo possa começar, você precisa carregar os dados e passá-los para o modelo no formato correto. No PyTorch, isso é tratado por conjuntos de dados e DataLoaders. Vamos começar criando um conjunto de dados do PyTorch para nossos dados de potabilidade da água.

Neste exercício, você definirá uma classe chamada WaterDataset para carregar os dados de um arquivo CSV. Para fazer isso, você precisará implementar os três métodos que o PyTorch espera que um conjuntos de dados tenha:

  • .__init__() para carregar os dados,
  • .__len__() para retornar o tamanho dos dados,
  • .__getitem()__ para extrair recursos e rótulos de uma única amostra.

As seguintes importações de que você precisa já foram feitas para você:

import pandas as pd
from torch.utils.data import Dataset

Este exercício faz parte do curso

Aprendizagem profunda intermediária com PyTorch

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

class WaterDataset(Dataset):
    def __init__(self, csv_path):
        super().__init__()
        # Load data to pandas DataFrame
        df = ____
        # Convert data to a NumPy array and assign to self.data
        ____ = ____.____
Editar e executar código