Rete LSTM

Come già sai, le celle RNN semplici non sono molto usate in pratica. Un'alternativa più comune, che gestisce molto meglio le sequenze lunghe, sono le Long Short-Term Memory, o LSTM. In questo esercizio costruirai tu una rete LSTM!

La differenza di implementazione più importante rispetto alla rete RNN che hai creato prima è che le LSTM hanno due stati nascosti invece di uno. Questo significa che dovrai inizializzare questo stato nascosto aggiuntivo e passarlo alla cella LSTM.

torch e torch.nn sono già stati importati per te, quindi puoi iniziare a scrivere il codice!

Questo esercizio fa parte del corso

Deep Learning intermedio con PyTorch

Visualizza corso

Istruzioni dell'esercizio

Nel metodo .__init__(), definisci un livello LSTM e assegnalo a self.lstm.
Nel metodo forward(), inizializza con zeri il primo stato nascosto della memoria a lungo termine c0.
Nel metodo forward(), passa tutti e tre gli input al livello LSTM: gli input dell'istante corrente e una tupla che contiene i due stati nascosti.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

class Net(nn.Module):
    def __init__(self, input_size):
        super().__init__()
        # Define lstm layer
        ____ = ____(
            input_size=1,
            hidden_size=32,
            num_layers=2,
            batch_first=True,
        )
        self.fc = nn.Linear(32, 1)

    def forward(self, x):
        h0 = torch.zeros(2, x.size(0), 32)
        # Initialize long-term memory
        c0 = ____
        # Pass all inputs to lstm layer
        out, _ = ____
        out = self.fc(out[:, -1, :])
        return out

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Deep Learning intermedio con PyTorch

IntermediárioNível de habilidade

4.8+

Inizia il corso gratuitamente

Impara ad addestrare reti neurali in modo robusto. In questo capitolo userai la programmazione orientata agli oggetti per definire dataset e modelli in PyTorch e ripasserai come addestrare e valutare reti neurali. Inoltre, conoscerai diversi ottimizzatori e, infine, affronterai varie tecniche che aiutano a mitigare i problemi di gradienti instabili, così comuni nell'addestramento delle reti neurali.

Exercise 1: PyTorch e programmazione orientata agli oggetti Exercise 2: Dataset PyTorch Exercise 3: PyTorch DataLoader Exercise 4: Modello PyTorch Exercise 5: Ottimizzatori, training e valutazione Exercise 6: Training loop Exercise 7: Ottimizzatori Exercise 8: Valutazione del modello Exercise 9: Gradienti che svaniscono ed esplodono Exercise 10: Inizializzazione e attivazione Exercise 11: Attivazioni: ReLU vs. ELU Exercise 12: Batch Normalization

Addestra reti neurali per risolvere compiti di classificazione di immagini. In questo capitolo imparerai a gestire dati di immagini in PyTorch e prenderai confidenza con le convolutional neural networks (CNN). Metterai in pratica l’addestramento e la valutazione di un classificatore di immagini, imparando anche a migliorare le prestazioni del modello con la data augmentation.

Exercise 1: Gestire le immagini con PyTorch Exercise 2: Insieme di immagini (dataset)Exercise 3: Data augmentation Exercise 4: Data augmentation in PyTorch Exercise 5: Convolutional Neural Networks Exercise 6: Il livello convoluzionale Exercise 7: Costruire reti convoluzionali Exercise 8: Addestrare i classificatori di immagini Exercise 9: Scelta delle aumentazioni Exercise 10: Insieme di dati con augmentations Exercise 11: Ciclo di training del classificatore di immagini Exercise 12: Valutare i classificatori di immagini Exercise 13: Valutazione di un modello multi-classe Exercise 14: Analizzare le metriche per classe

Crea e addestra recurrent neural networks (RNN) per elaborare dati sequenziali come serie temporali, testo o audio. Imparerai le due architetture ricorrenti più diffuse, Long Short-Term Memory (LSTM) e Gated Recurrent Unit (GRU), e come preparare i dati sequenziali per l’addestramento del modello. Metterai in pratica le competenze addestrando e valutando un modello ricorrente per prevedere i consumi di elettricità.

Exercise 1: Gestire le sequenze con PyTorch Exercise 2: Generare sequenze Exercise 3: Insieme di dati sequenziale Exercise 4: Reti neurali ricorrenti Exercise 5: Architetture sequenziali Exercise 6: Costruire un RNN per il forecasting Exercise 7: Celle LSTM e GRU Exercise 8: RNN vs. LSTM vs. GRU Exercise 9: Rete LSTM

Esercizio attuale

Exercise 10: Rete GRU Exercise 11: Addestrare e valutare le RNN Exercise 12: Ciclo di training RNN Exercise 13: Valutare i modelli di forecasting

Crea modelli multi-input e multi-output, mostrando come possano gestire compiti che richiedono più di un input o generano più output. Esplorerai come progettare e addestrare questi modelli con PyTorch e approfondirai il tema cruciale del bilanciamento delle perdite nei modelli multi-output. Ciò implica capire come bilanciare l’importanza dei diversi compiti quando si addestra un modello a svolgere più compiti contemporaneamente.

Exercise 1: Modelli con input multipli Exercise 2: Insieme di dati con due input Exercise 3: Modello con due input Exercise 4: Addestramento del modello con due input Exercise 5: Modelli multi-output Exercise 6: Dataset e DataLoader a due uscite Exercise 7: Architettura del modello a due output Exercise 8: Addestrare modelli multi-output Exercise 9: Valutazione dei modelli multi-output e pesatura delle loss Exercise 10: Valutazione di modelli multi-output Exercise 11: Ponderazione della loss Exercise 12: Riepilogo