1. 学ぶ
  2. /
  3. コース
  4. /
  5. 使用 Pinecone 的向量数据库与 Embeddings

Connected

演習

并行批量 upsert

在本练习中,您将练习并行向 Pinecone 的 'datacamp-index' 索引写入向量。您需要连接到该索引,异步按批次 upsert 向量,并检查 'datacamp-index' 的更新后指标。

您之前创建的辅助函数 chunks() 仍可使用:

def chunks(iterable, batch_size=100):
    """A helper function to break an iterable into chunks of size batch_size."""
    it = iter(iterable)
    chunk = tuple(itertools.islice(it, batch_size))
    while chunk:
        yield chunk
        chunk = tuple(itertools.islice(it, batch_size))

指示

100 XP
  • 初始化 Pinecone 客户端,使其允许 20 个并发请求。
  • 将 vectors 按每次请求 200 个向量的批次进行 upsert,并以异步方式执行,配置 20 个并发请求。
  • 打印 Pinecone 索引 'datacamp-index' 的最新指标。