1. 学ぶ
  2. /
  3. コース
  4. /
  5. 人間のフィードバックによる強化学習(RLHF)

Connected

演習

ジムのキャンペーン用スローガンの比較

あなたは広告代理店と協力して、ジムのキャンペーン用スローガンを生成する2つのモデルを評価しています。各モデルは、対応する効果スコア付きのスローガン一覧を生成しました。あなたのタスクは、各モデルが生成したスローガンを比較し、どちらのモデルが全体として優れているかを判断し、各モデルの成功率を計算することです。

スローガンはあらかじめ slogans_X と slogans_Y に読み込まれており、スローガンとそのスコアを含むタプルのリストになっています。

指示

100 XP
  • 各スローガンのペアについて、スローガンXのスコアが高ければ wins_X を 1 増やし、スローガンYのスコアが高ければ wins_Y を 1 増やしてください。