1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)

Connected

ćwiczenie

Ocena RLHF za pomocą metryk

Trenujesz model przy użyciu uczenia ze wzmocnieniem na podstawie informacji zwrotnej od człowieka (RLHF) i chcesz ocenić jego działanie za pomocą odpowiednich metryk.

Która z poniższych opcji najlepiej nadaje się do oceny zadania polegającego na streszczaniu tekstu z użyciem automatycznych metryk?

Możesz zwizualizować dane w konsoli, aby zdecydować, która metryka jest najlepiej dopasowana do tego zadania. Dane do oceny zostały wstępnie załadowane jako DataFrame o nazwie df_evaluation.

Instrukcje

50 XP

Możliwe odpowiedzi