Agrupando upserts em paralelo

Neste exercício, você vai praticar a ingestão de vetores no índice Pinecone do 'datacamp-index' em paralelo. Você vai precisar se conectar ao índice, fazer upsert de vetores em lotes de forma assíncrona e conferir as métricas atualizadas do índice 'datacamp-index'.

A função auxiliar chunks() que você criou anteriormente ainda está disponível para uso:

def chunks(iterable, batch_size=100):

    """A helper function to break an iterable into chunks of size batch_size."""

    it = iter(iterable)

    chunk = tuple(itertools.islice(it, batch_size))

    while chunk:

        yield chunk

        chunk = tuple(itertools.islice(it, batch_size))

Este exercício faz parte do curso

Bancos de dados vetoriais para incorporações com Pinecone

Instruções do exercício

Inicialize o cliente Pinecone pra permitir 20 solicitações ao mesmo tempo.
Insira os vetores em vectors em lotes de 200 vetores por solicitação de forma assíncrona, configurando 20 solicitações simultâneas.
Imprima as métricas atualizadas do índice Pinecone 'datacamp-index'.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the client
pc = Pinecone(api_key="____", ____)

index = pc.Index('datacamp-index')

# Upsert vectors in batches of 200 vectors
with pc.Index('datacamp-index', ____) as index:
    async_results = [____(vectors=chunk, ____) for chunk in chunks(vectors, batch_size=____)]
    [async_result.get() for async_result in async_results]

# Retrieve statistics of the connected Pinecone index
print(____)

Editar e executar o código

Este exercício faz parte do curso

Bancos de dados vetoriais para incorporações com Pinecone

IntermediárioNível de habilidade

4.8+

Iniciar curso de graça

Dá uma olhada em como funciona o banco de dados vetorial do Pinecone, desde os pods e índices até como ele se compara com outros bancos de dados. Aprenda a diferenciar tipos de pods, pegar chaves API e inicializar a conexão com o Pinecone usando Python. Por fim, você vai aprender a criar índices Pinecone, explorando diferentes parâmetros, como dimensionalidade, métricas de distância, tipos de pod e outros.

Exercise 1: Introdução aos índices Pinecone Exercise 2: Criando um cliente Pinecone Exercise 3: Seu primeiro índice Pinecone Exercise 4: Gerenciando índices Exercise 5: Conectando-se a um índice Exercise 6: Como apagar um índice Exercise 7: O ecossistema Pinecone Exercise 8: Ingestão de vetores Exercise 9: Verificando a dimensionalidade Exercise 10: Ingerindo vetores com metadados

Experimente o Pinecone em Python, onde a gente vai ver como é usar o Pinecone na prática pra gerenciar índices, adicionar vetores com metadados, procurar e recuperar vetores, além de fazer atualizações ou exclusões. Entenda bem as principais funções e ideias para lidar com os dados no banco de dados vetorial Pinecone.

Exercise 1: Recuperando vetores Exercise 2: Consultar vs. buscar Exercise 3: Buscando vetores Exercise 4: Consultando vetores Exercise 5: Retornando os vetores mais parecidos Exercise 6: Alterando as métricas de distância Exercise 7: Filtragem de metadados Exercise 8: Filtrando consultas Exercise 9: Vários filtros de metadados Exercise 10: Atualizando e apagando vetores Exercise 11: Atualizando valores vetoriais Exercise 12: Atualizando metadados vetoriais Exercise 13: Apagando vetores

Neste capítulo, os alunos vão aprender a otimizar o desempenho do índice Pinecone, usar namespaces multi-tenant pra reduzir custos, criar mecanismos de pesquisa semântica e sistemas de resposta a perguntas com recuperação aumentada usando o Pinecone com a API OpenAI. Com essas aulas, os alunos aprendem coisas práticas sobre como ajustar o desempenho, fazer buscas semânticas e responder perguntas com mais informações, o que os deixa prontos para usar o Pinecone de verdade em aplicações de IA no mundo real.

Exercise 1: Agrupamento de upserts Exercise 2: Definindo uma função para fragmentação Exercise 3: Agrupando upserts em pedaços Exercise 4: Agrupando upserts em paralelo

Exercício atual

Exercise 5: Multitenancy e namespaces Exercise 6: Espaços de nomes Exercise 7: Consultando namespaces Exercise 8: Pesquisa semântica com Pinecone Exercise 9: Criando e configurando um índice Pinecone Exercise 10: Inserção de vetores para pesquisa semântica Exercise 11: Consultando vetores para pesquisa semântica Exercise 12: Chatbot RAG com Pinecone e OpenAI Exercise 13: Inserir transcrições do YouTube Exercise 14: Criando uma função de recuperação Exercise 15: Função de resposta a perguntas RAG Exercise 16: Parabéns!