1. 学ぶ
  2. /
  3. コース
  4. /
  5. PyTorchによる中級ディープラーニング

Connected

演習

2出力モデルのアーキテクチャ

この演習では、文字とアルファベットの両方を予測できるマルチ出力ニューラルネットワークのアーキテクチャを構築します。

一般的な構成を思い出してください。.__init__() メソッドでは、後で forward パスで使用する層を定義します。forward() メソッドでは、まず入力画像をいくつかの層に通して埋め込みを得てから、その埋め込みを2つの別々の分類器層(それぞれの出力に対応)に入力します。

torch.nn は通常のエイリアスで既にインポートされています。では、モデルを作りましょう!

指示1 / 2

undefined XP
    1
    2
  • self.classifier_alpha と self.classifier_char を線形層として定義します。入力形状は image_layer の出力に一致させ、出力形状はそれぞれアルファベットの数(30)と文字の数(964)に対応させます。