1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Cơ sở dữ liệu vector cho Embeddings với Pinecone

Connected

Bài tập

Gộp upsert và chạy song song

Trong bài tập này, bạn sẽ luyện tập nạp vector vào chỉ mục Pinecone 'datacamp-index' theo kiểu song song. Bạn sẽ cần kết nối tới chỉ mục, upsert các vector theo lô một cách bất đồng bộ, và kiểm tra các chỉ số (metrics) đã được cập nhật của chỉ mục 'datacamp-index'.

Hàm trợ giúp chunks() mà bạn đã tạo trước đó vẫn có sẵn để dùng:

def chunks(iterable, batch_size=100):
    """A helper function to break an iterable into chunks of size batch_size."""
    it = iter(iterable)
    chunk = tuple(itertools.islice(it, batch_size))
    while chunk:
        yield chunk
        chunk = tuple(itertools.islice(it, batch_size))

Hướng dẫn

100 XP
  • Khởi tạo client Pinecone để cho phép 20 yêu cầu đồng thời.
  • Upsert các vector trong vectors theo lô 200 vector mỗi yêu cầu theo kiểu bất đồng bộ, cấu hình 20 yêu cầu đồng thời.
  • In ra các chỉ số (metrics) đã được cập nhật của chỉ mục Pinecone 'datacamp-index'.