LSTM-Netz

Wie du bereits weißt, werden einfache RNN-Zellen in der Praxis nicht sehr häufig verwendet. Eine häufiger verwendete Alternative, die eine viel bessere Verarbeitung langer Sequenzen gewährleistet, sind Long Short-Term Memory-Zellen oder LSTMs. In dieser Aufgabe wirst du selbst ein LSTM-Netz aufbauen!

Der wichtigste Implementierungsunterschied zum RNN-Netz, das du zuvor erstellt hast, ergibt sich aus der Tatsache, dass LSTMs zwei statt einem versteckten Zustand haben. Das bedeutet, dass du diesen zusätzlichen versteckten Zustand initialisieren und an die LSTM-Zelle übergeben musst.

torch und torch.nn wurden bereits für dich importiert, also fang an zu programmieren!

Diese Übung ist Teil des Kurses

Deep Learning mit PyTorch für Fortgeschrittene

Anleitung zur Übung

Definiere in der .__init__()-Methode eine LSTM-Schicht und weise sie self.lstm zu.
Initialisiere in der forward()-Methode den ersten versteckten Zustand des Long-Term Memory c0 mit Nullen.
Übergib in der forward()-Methode alle drei Inputs an die LSTM-Schicht: die Inputs des aktuellen Zeitschritts und ein Tupel mit den beiden versteckten Zuständen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

class Net(nn.Module):
    def __init__(self, input_size):
        super().__init__()
        # Define lstm layer
        ____ = ____(
            input_size=1,
            hidden_size=32,
            num_layers=2,
            batch_first=True,
        )
        self.fc = nn.Linear(32, 1)

    def forward(self, x):
        h0 = torch.zeros(2, x.size(0), 32)
        # Initialize long-term memory
        c0 = ____
        # Pass all inputs to lstm layer
        out, _ = ____
        out = self.fc(out[:, -1, :])
        return out

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Deep Learning mit PyTorch für Fortgeschrittene

Mittlere SchwierigkeitSchwierigkeitsgrad

4.8+

Kurs kostenlos starten

Lerne, wie du neuronale Netze auf robuste Weise trainierst. In diesem Kapitel wirst du objektorientierte Programmierung verwenden, um PyTorch-Datensätze und -Modelle zu definieren und dein Wissen über das Training und die Auswertung neuronaler Netze aufzufrischen. Du wirst außerdem verschiedene Optimierer kennenlernen und dich schließlich mit verschiedenen Techniken vertraut machen, die dabei helfen, die beim Training neuronaler Netze so häufig auftretenden Probleme instabiler Gradienten zu minimieren.

Exercise 1: PyTorch und objektorientierte Programmierung Exercise 2: PyTorch-Dataset Exercise 3: PyTorch DataLoader Exercise 4: PyTorch-Modell Exercise 5: Optimierer, Training und Bewertung Exercise 6: Trainingsschleife Exercise 7: Optimizer Exercise 8: Modellevaluierung Exercise 9: Verschwindende und explodierende Gradienten Exercise 10: Initialisierung und Aktivierung Exercise 11: Aktivierungen: ReLU vs. ELU Exercise 12: Batch-Normalisierung

Trainiere neuronale Netze zur Lösung von Bildklassifizierungsaufgaben. In diesem Kapitel lernst du, wie du Bilddaten in PyTorch verarbeitest und machst dich mit Convolutional Neural Networks (CNNs) vertraut. Du übst das Training und die Auswertung eines Bildklassifikators und lernst dabei, wie du die Modellleistung durch Data Augmentation verbessern kannst.

Exercise 1: Bildverarbeitung mit PyTorch Exercise 2: Bilddatensatz Exercise 3: Data Augmentation Exercise 4: Data Augmentation in PyTorch Exercise 5: Convolutional Neural Networks Exercise 6: Die Faltungsschicht Exercise 7: Aufbau von Convolutional Networks Exercise 8: Training von Bildklassifikatoren Exercise 9: Augmentierungen auswählen Exercise 10: Datensatz mit Augmentierungen Exercise 11: Trainingsschleife für Bildklassifikator Exercise 12: Bewertung von Bildklassifikatoren Exercise 13: Evaluierung von Multi-Klassen-Modellen Exercise 14: Analyse der Metriken pro Klasse

Erstelle und trainiere rekurrente neuronale Netze (RNNs) zur Verarbeitung sequenzieller Daten wie Zeitreihen, Text oder Audio. Du lernst die zwei beliebtesten rekurrenten Architekturen kennen: Long-Short Term Memory (LSTM) und Gated Recurrent Unit (GRU), sowie die Vorbereitung sequenzieller Daten für das Modelltraining. Du wirst deine Fähigkeiten üben, indem du ein rekurrentes Modell für die Vorhersage des Stromverbrauchs trainierst und auswertest.

Exercise 1: Sequenzverarbeitung mit PyTorch Exercise 2: Sequenzen generieren Exercise 3: Sequentielles Dataset Exercise 4: Rekurrente neuronale Netze Exercise 5: Sequenzielle Architekturen Exercise 6: Ein Vorhersagemodell mit RNN erstellen Exercise 7: LSTM- und GRU-Zellen Exercise 8: RNN vs. LSTM vs. GRU Exercise 9: LSTM-Netz

Aktuelle Übung

Exercise 10: GRU-Netz Exercise 11: Training und Auswertung von RNNs Exercise 12: RNN-Trainingsschleife Exercise 13: Prognosemodelle evaluieren

Entwickle Multi-Input- und Multi-Output-Modelle und lerne, wie sie Aufgaben bewältigen können, die mehr als einen Input benötigen oder mehrere Outputs generieren. Du wirst lernen, wie du diese Modelle mit PyTorch entwickelst und trainierst, und dich mit dem wichtigen Thema der Verlustgewichtung in Multi-Output-Modellen beschäftigen. Dabei geht es darum zu verstehen, wie man die Bedeutung verschiedener Aufgaben ausbalanciert, wenn ein Modell mehrere Aufgaben gleichzeitig ausführen soll.

Exercise 1: Multi-Input-Modelle Exercise 2: Datensatz mit zwei Inputs Exercise 3: Modell mit zwei Inputs Exercise 4: Training eines Modells mit zwei Inputs Exercise 5: Multi-Output-Modelle Exercise 6: Dataset und DataLoader mit zwei Outputs Exercise 7: Modellarchitektur mit zwei Outputs Exercise 8: Training von Multi-Output-Modellen Exercise 9: Bewertung von Multi-Output-Modellen und Gewichtung der Verlustfunktion Exercise 10: Evaluierung von Multi-Output-Modellen Exercise 11: Verlustgewichtung Exercise 12: Zusammenfassung