1. 학습
  2. /
  3. 강의
  4. /
  5. Pinecone으로 배우는 임베딩용 벡터 데이터베이스

Connected

연습 문제

시맨틱 검색을 위한 벡터 업서트

이제 텍스트 데이터를 임베딩하고, 벡터와 메타데이터를 'pinecone-datacamp' 인덱스에 업서트해 보세요! squad_dataset.csv라는 데이터셋이 제공되며, 그중 200개 샘플이 DataFrame df로 로드되어 있어요.

이 연습에서는 OpenAI API의 임베딩 모델을 사용하기 위해 별도로 API 키를 생성하거나 사용할 필요가 없습니다. 유효한 OpenAI 클라이언트가 이미 생성되어 client 변수에 할당되어 있어요.

여러분의 과제는 OpenAI API로 텍스트를 임베딩한 뒤, 임베딩과 메타데이터를 squad_dataset 네임스페이스 아래 Pinecone 인덱스에 업서트하는 것입니다.

지침

100 XP
  • Pinecone 클라이언트를 본인의 API 키로 초기화하세요(OpenAI 클라이언트는 이미 client로 제공됩니다).
  • 배치의 각 row에서 'id', 'text', 'title' 메타데이터를 추출하세요.
  • OpenAI의 'text-embedding-3-small'을 사용해 차원 1536으로 texts를 인코딩하세요.
  • 벡터와 메타데이터를 'squad_dataset' 네임스페이스에 업서트하세요.