학습

/

강의

/

Reinforcement Learning from Human Feedback (RLHF)

Connected

연습 문제

리뷰 분류를 위한 파인튜닝

프로젝트를 이어서, 이제 리뷰를 긍정, 중립, 부정으로 분류하려고 해요. 파인튜닝된 모델을 사용해 리뷰를 자동으로 범주화할 거예요.

transformers에서 TrainingArguments와 Trainer 클래스가 이미 임포트되어 있어요. training_args, model, tokenized_datasets도 미리 임포트되어 있어요.

지침

100 XP

tokenized_datasets 데이터셋에서 "train"과 "test" 하위 집합을 사용해 학습/테스트 데이터셋을 만드세요.
Trainer 클래스를 초기화하세요.
학습 인자를 클래스에 추가하세요.