1. 학습
  2. /
  3. 강의
  4. /
  5. OpenAI API로 시작하는 임베딩 Introduction

Connected

연습 문제

리뷰 감성 분류하기

이제 임베딩을 계산했으니, 코사인 거리를 구하고 가장 유사한 레이블을 추출해 볼 차례예요.

이를 위해 하나의 벡터를 여러 벡터와 비교해 가장 가까운 거리와 그 인덱스를 반환하는 find_closest() 함수를 정의할 거예요. 그런 다음 리뷰를 반복하며 각 리뷰에 대해 find_closest()로 가장 가까운 거리를 찾고, 해당 인덱스를 사용해 분류된 레이블을 추출합니다.

이전 연습 문제에서 만든 class_embeddings와 review_embeddings 객체가 준비되어 있으며, reviews와 sentiments도 함께 사용할 수 있어요.

지침

100 XP
  • find_closest() 함수를 정의해 query_vector와 가장 유사한 임베딩의 거리와 인덱스를 반환하세요.
  • 각 리뷰의 임베딩과 class_embeddings 간의 가장 가까운 거리를 find_closest()로 찾으세요.
  • closest의 'index'를 사용해 sentiments를 부분 선택하고 'label'을 추출하세요.