학습

/

강의

/

Python으로 배우는 LLM 입문

Connected

연습 문제

ROUGE로 평가하기

ROUGE는 예측과 기준 답안 간의 유사도를 확인하므로 요약 과제를 평가할 때 흔히 사용돼요. 모델이 생성한 요약 predictions와 검증용 기준 요약 references가 제공되어 있어요. 점수를 계산해 모델의 성능을 확인해 보세요.

evaluate 라이브러리는 미리 불러와 두었어요.

지침

100 XP

ROUGE 메트릭을 로드하세요.
예측 요약과 기준 요약 사이의 ROUGE 점수를 계산하세요.