Red LSTM

Como ya sabes, las celdas simples RNN no se utilizan mucho en la práctica. Una alternativa más utilizada y que garantiza un manejo mucho mejor de las secuencias largas son las celdas de memoria a corto plazo, o LSTM. En este ejercicio, vas a construir una red LSTM.

La diferencia de implementación más importante respecto a la red RNN que has construido anteriormente proviene del hecho de que las LSTM tienen dos estados ocultos en lugar de uno. Esto significa que tendrás que inicializar este estado oculto adicional y pasarlo a la celda LSTM.

torch y torch.nn ya se han importado para ti, ¡así que empieza a codificar!

Este ejercicio forma parte del curso

Aprendizaje profundo intermedio con PyTorch

Instrucciones del ejercicio

En el método .__init__(), define una capa LSTM y asígnala a self.lstm.
En el método forward(), inicializa el primer estado oculto de la memoria a largo plazo c0 con ceros.
En el método forward(), pasa las tres entradas a la capa LSTM: las entradas del paso de tiempo actual y una tupla que contenga los dos estados ocultos.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

class Net(nn.Module):
    def __init__(self, input_size):
        super().__init__()
        # Define lstm layer
        ____ = ____(
            input_size=1,
            hidden_size=32,
            num_layers=2,
            batch_first=True,
        )
        self.fc = nn.Linear(32, 1)

    def forward(self, x):
        h0 = torch.zeros(2, x.size(0), 32)
        # Initialize long-term memory
        c0 = ____
        # Pass all inputs to lstm layer
        out, _ = ____
        out = self.fc(out[:, -1, :])
        return out

Editar y ejecutar código

Este ejercicio forma parte del curso

Aprendizaje profundo intermedio con PyTorch

IntermedioNivel de habilidad

4.8+

Comienza el curso gratis

Aprende a entrenar redes neuronales con calidad. En este capítulo, utilizarás la programación orientada a objetos para definir conjuntos de datos y modelos PyTorch y actualizarás tus conocimientos sobre el entrenamiento y la evaluación de redes neuronales. También te familiarizarás con distintos optimizadores y, por último, te familiarizarás con diversas técnicas que ayudan a mitigar los problemas de gradientes inestables tan omnipresentes en el entrenamiento de redes neuronales.

Exercise 1: PyTorch y la programación orientada a objetos Exercise 2: Conjunto de datos PyTorch Exercise 3: DataLoader PyTorch Exercise 4: Modelo PyTorch Exercise 5: Optimizadores, formación y evaluación Exercise 6: Bucle de entrenamiento Exercise 7: Optimizadores Exercise 8: Evaluación del modelo Exercise 9: Desvanecimiento y explosión de gradientes Exercise 10: Inicialización y activación Exercise 11: Activaciones: ReLU frente a ELU Exercise 12: Normalización por lotes

Entrena redes neuronales para resolver tareas de clasificación de imágenes. En este capítulo, aprenderás a manejar datos de imágenes en PyTorch y a familiarizarte con las redes neuronales convolucionales (CNN). Practicarás el entrenamiento y la evaluación de un clasificador de imágenes mientras aprendes cómo mejorar el rendimiento del modelo con el aumento de datos.

Exercise 1: Manipulación de imágenes con PyTorch Exercise 2: Conjunto de datos de imágenes Exercise 3: Aumento de datos Exercise 4: Aumento de datos en PyTorch Exercise 5: Redes neuronales convolucionales Exercise 6: La capa convolucional Exercise 7: Construcción de redes convolucionales Exercise 8: Entrenamiento de clasificadores de imágenes Exercise 9: Elección de los aumentos Exercise 10: Conjunto de datos con aumentos Exercise 11: Bucle de entrenamiento del clasificador de imágenes Exercise 12: Evaluación de clasificadores de imágenes Exercise 13: Evaluación de modelos multiclase Exercise 14: Análisis de las métricas por clase

Construye y entrena redes neuronales recurrentes (RNN) para procesar datos secuenciales como series temporales, texto o audio. Aprenderás sobre las dos arquitecturas recurrentes más populares, las redes de memoria a corto plazo (LSTM) y de unidad recurrente controlada (GRU), así como a preparar datos secuenciales para el entrenamiento del modelo. Practicarás tus habilidades entrenando y evaluando un modelo recurrente para predecir el consumo de electricidad.

Exercise 1: Manejo de secuencias con PyTorch Exercise 2: Generación de secuencias Exercise 3: Conjunto de datos secuenciales Exercise 4: Redes neuronales recurrentes Exercise 5: Arquitecturas secuenciales Exercise 6: Construcción de una previsión RNN Exercise 7: Celdas LSTM y GRU Exercise 8: RNN frente a LSTM frente a GRU Exercise 9: Red LSTM

Ejercicio actual

Exercise 10: Red GRU Exercise 11: Formación y evaluación de RNN Exercise 12: Bucle de entrenamiento de RNN Exercise 13: Evaluación de los modelos de previsión

Construye modelos multientrada y multisalida y demuestra cómo pueden manejar tareas que requieran más de una entrada o generen múltiples salidas. Vas a explorar cómo diseñar y entrenar estos modelos con PyTorch y profundizarás en el tema crucial de la ponderación de las pérdidas en los modelos multisalida. Esto implica comprender cómo equilibrar la importancia de las distintas tareas cuando se entrena a un modelo para que realice varias tareas simultáneamente.

Exercise 1: Modelos multientrada Exercise 2: Conjunto de datos de dos entradas Exercise 3: Modelo de dos entradas Exercise 4: Entrenamiento del modelo de dos entradas Exercise 5: Modelos multisalida Exercise 6: Conjunto de datos de dos salidas y DataLoader Exercise 7: Arquitectura del modelo de dos salidas Exercise 8: Entrenamiento de modelos multisalida Exercise 9: Evaluación de modelos multisalida y ponderación de pérdidas Exercise 10: Evaluación del modelo multisalida Exercise 11: Pérdida de peso Exercise 12: Resumen