1. 学ぶ
  2. /
  3. コース
  4. /
  5. 人間のフィードバックによる強化学習(RLHF)

Connected

演習

Active learning のループ

アクティブラーナーの設定ができたので、実際に使ってみましょう。この演習では、データのカテゴリ分類を継続的に改善できるループを実装します。

データセットはすでに読み込まれており、ラベル付きの学習データは X_labeled、ラベルなしの学習データは X_unlabeled、ラベルは y_labeled に入っています。

learner オブジェクトは事前にインポート済みです。

指示

100 XP
  • 10 回のクエリを実行するループを実装します。
  • 各イテレーションで、現在のラベル付きデータを使って learner が自己学習するようにします。
  • learner を使って、ラベルなしデータから最も不確かなデータポイントを問い合わせ、インスタンス数は 5 に設定します。
  • それに応じて、ラベルなしデータセットを更新します。