1. 学ぶ
  2. /
  3. コース
  4. /
  5. 人間のフィードバックによる強化学習(RLHF)

Connected

演習

レビュー分類のためのファインチューニング

プロジェクトを続けます。ここではレビューをポジティブ・ニュートラル・ネガティブに分類したいとします。ファインチューニング済みモデルを使って、レビューを自動でカテゴリ分けします。

transformers から TrainingArguments と Trainer クラスがインポートされています。 また、training_args、model、tokenized_datasets もあらかじめ読み込まれています。

指示

100 XP
  • tokenized_datasets データセットの "train" と "test" サブセットを使って、学習用とテスト用のデータセットを作成します。
  • Trainer クラスを初期化します。
  • そのクラスにトレーニング引数を追加します。