1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 LLM 입문

Connected

연습 문제

ROUGE로 평가하기

ROUGE는 예측과 기준 답안 간의 유사도를 확인하므로 요약 과제를 평가할 때 흔히 사용돼요. 모델이 생성한 요약 predictions와 검증용 기준 요약 references가 제공되어 있어요. 점수를 계산해 모델의 성능을 확인해 보세요.

evaluate 라이브러리는 미리 불러와 두었어요.

지침

100 XP
  • ROUGE 메트릭을 로드하세요.
  • 예측 요약과 기준 요약 사이의 ROUGE 점수를 계산하세요.