Problém mizejících gradientů

Druhým možným problémem s gradienty je jejich mizení – gradienty se blíží nule. Tento problém se řeší obtížněji, protože ho není snadné odhalit. Pokud se ztrátová funkce v každém kroku nezlepšuje, je to proto, že gradienty klesly na nulu a váhy se neaktualizovaly? Nebo model prostě není schopen se učit?

Tento problém se u modelů RNN vyskytuje častěji tehdy, když je potřeba dlouhá paměť (například při práci s dlouhými větami).

V tomto cvičení sledujeme daný problém na datech IMDB s vybranými delšími větami. Data jsou načtena do proměnných X a y, k dispozici jsou také třídy Sequential, SimpleRNN, Dense a matplotlib.pyplot jako plt. Model byl předtrénován po dobu 100 epoch – jeho váhy a průběh trénování jsou uloženy v souboru model_weights.h5 a v proměnné history.

Přidej do modelu vrstvu SimpleRNN.
Načti předtrénované váhy do modelu pomocí metody .load_weights().
Přidej do grafu přesnost na trénovacích datech dostupnou pod atributem 'acc'.
Zobraz graf pomocí metody .show().

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení