ComenzarEmpieza gratis

Conjunto de datos PyTorch

¡Es hora de refrescar tus conocimientos sobre PyTorch Datasets!

Antes de que pueda comenzar el entrenamiento del modelo, tienes que cargar los datos y pasárselos al modelo en el formato adecuado. En PyTorch, esto se gestiona mediante Datasets y DataLoaders. Empecemos construyendo un conjunto de datos PyTorch para nuestros datos relacionados con la potabilidad del agua.

En este ejercicio, tienes que definir una clase llamada WaterDataset para cargar los datos de un archivo CSV. Para ello, tienes que implementar los tres métodos que PyTorch espera que tenga un conjunto de datos:

  • .__init__() para cargar los datos
  • .__len__() para devolver el tamaño de los datos
  • .__getitem()__ para extraer las características y la etiqueta de una sola muestra

Ya se ha importado lo que necesitas:

import pandas as pd
from torch.utils.data import Dataset

Este ejercicio forma parte del curso

Aprendizaje profundo intermedio con PyTorch

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

class WaterDataset(Dataset):
    def __init__(self, csv_path):
        super().__init__()
        # Load data to pandas DataFrame
        df = ____
        # Convert data to a NumPy array and assign to self.data
        ____ = ____.____
Editar y ejecutar código