1. Nauka
  2. /
  3. Kursy
  4. /
  5. Głębokie uczenie z PyTorch – poziom średnio zaawansowany

Connected

ćwiczenie

Sieć LSTM

Jak już wiesz, zwykłe komórki RNN rzadko stosuje się w praktyce. Częściej wybieraną alternatywą, która znacznie lepiej radzi sobie z długimi sekwencjami, są komórki Long Short-Term Memory, czyli LSTM. W tym ćwiczeniu samodzielnie zbudujesz sieć LSTM!

Najważniejsza różnica implementacyjna w porównaniu z wcześniej zbudowaną siecią RNN wynika z tego, że LSTM korzysta z dwóch stanów ukrytych zamiast jednego. Trzeba więc zainicjalizować ten dodatkowy stan i przekazać go do komórki LSTM.

torch i torch.nn są już zaimportowane – możesz zaczynać!

Instrukcje

100 XP
  • W metodzie .__init__() zdefiniuj warstwę LSTM i przypisz ją do self.lstm.
  • W metodzie forward() zainicjalizuj pierwszy długoterminowy stan ukryty c0 zerami.
  • W metodzie forward() przekaż do warstwy LSTM wszystkie trzy dane wejściowe: dane z bieżącego kroku czasowego oraz krotkę zawierającą dwa stany ukryte.