1. 학습
  2. /
  3. 강의
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

연습 문제

헬스장 캠페인 슬로건 비교하기

여러분은 광고 대행사와 협업해 헬스장 캠페인 슬로건을 생성하는 두 개 모델을 평가하고 있어요. 각 모델은 슬로건 목록과 해당 효과성 점수를 생성했습니다. 여러분의 과제는 각 모델이 만든 슬로건을 비교해 전반적으로 어떤 모델이 더 우수한지 판단하고, 각 모델의 성공률을 계산하는 거예요.

슬로건은 slogans_X와 slogans_Y로 미리 로드되어 있으며, 슬로건과 점수로 이루어진 튜플 리스트입니다.

지침

100 XP
  • 각 슬로건 쌍에 대해, 슬로건 X의 점수가 더 높으면 wins_X를 1 증가시키고, 슬로건 Y의 점수가 더 높으면 wins_Y를 1 증가시키세요.