1. 학습
  2. /
  3. 강의
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

연습 문제

지표로 RLHF 평가하기

여러분은 인간 피드백을 통한 강화학습(RLHF)으로 모델을 학습하고 있으며, 적절한 지표를 사용해 성능을 평가해야 합니다.

다음 중 자동화된 지표로 요약 작업을 평가하는 데 가장 적합한 것은 무엇인가요?

콘솔을 사용해 데이터를 시각화하며 어떤 지표가 이 작업에 가장 적합한지 판단해 보세요. 평가해야 할 데이터는 df_evaluation라는 DataFrame으로 미리 로드되어 있습니다.

지침

50 XP

가능한 답변