1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

cvičení

Hodnocení RLHF pomocí metrik

Trénuješ model pomocí zpětnovazebního učení s lidskou zpětnou vazbou (RLHF) a potřebuješ vyhodnotit jeho výkon pomocí vhodných metrik.

Která z následujících možností je nejlépe vhodná pro vyhodnocení úlohy shrnutí textu pomocí automatizovaných metrik?

Pro rozhodnutí, která metrika je pro danou úlohu nejvhodnější, můžeš vizualizovat data v konzoli. Data určená k vyhodnocení jsou předem načtena jako DataFrame s názvem df_evaluation.

Pokyny

50 XP

Možné odpovědi