1. Nauka
  2. /
  3. Kursy
  4. /
  5. Głębokie uczenie z PyTorch – poziom średnio zaawansowany

Connected

ćwiczenie

Trenowanie modeli wielowyjściowych

Podczas trenowania modeli z wieloma wyjściami niezwykle ważne jest poprawne zdefiniowanie funkcji straty.

W tym przypadku model produkuje dwa wyjścia: predykcje alfabetu oraz znaku. Dla każdego z nich istnieją odpowiednie etykiety prawdziwych wartości, które pozwalają obliczyć dwie oddzielne straty: jedną wynikającą z błędnej klasyfikacji alfabetu, a drugą – z błędnej klasyfikacji znaku. Ponieważ w obu przypadkach mamy do czynienia z zadaniem klasyfikacji wieloetykietowej, za każdym razem można zastosować stratę entropii krzyżowej.

Gradient descent może jednak optymalizować tylko jedną funkcję straty. Dlatego całkowitą stratę zdefiniujesz jako sumę straty alfabetu i straty znaku.

Instrukcje

100 XP
  • Oblicz stratę klasyfikacji alfabetu i przypisz ją do loss_alpha.
  • Oblicz stratę klasyfikacji znaku i przypisz ją do loss_char.
  • Oblicz całkowitą stratę jako sumę dwóch składowych strat i przypisz ją do loss.