1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶDeep Reinforcement Learning

Connected

Exercise

エントロピーで遊んでみよう

エントロピーの概念に初めて触れる方は、具体例で直感をつかむと理解しやすいです。

引数に確率のリストを受け取る関数 plot_probabilities を作成します。エントロピーを計算し、確率を棒グラフで可視化します。

エントロピーをいろいろ試すと、確率分布が多くの行動に分散しているほどエントロピーが高くなることが分かるはずです。

torch.distribution.Categorical クラスは環境内で Categorical として読み込まれています。このクラスのメソッド .entropy() は、エントロピーを nat 単位で返します。

Instrukcje

100 XP
  • 確率分布のエントロピーを nat 単位で取得します。
  • 便利のため、エントロピーを nat から bit に変換します。
  • 別のリストを関数の入力として試してみてください。