1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

cvičení

Porovnávání sloganů pro kampaň fitness centra

Spolupracuješ s reklamní agenturou na vyhodnocení dvou modelů, které generují slogany pro kampaň fitness centra. Každý model vytvořil seznam sloganů spolu s odpovídajícím skóre efektivity. Tvým úkolem je porovnat slogany vygenerované jednotlivými modely, zjistit, který model je celkově lepší, a vypočítat míru úspěšnosti každého z nich.

Slogany jsou předem načteny jako slogans_X a slogans_Y — jde o seznamy n-tic obsahujících slogan a jeho skóre.

Pokyny

100 XP
  • Pro každý pár sloganů: pokud je skóre sloganu X vyšší, zvyš wins_X o 1; pokud je vyšší skóre sloganu Y, zvyš wins_Y o 1.