Função de resposta a perguntas RAG

Você está quase lá! A última etapa do fluxo de trabalho RAG é juntar os documentos que a gente encontrou com um modelo de perguntas e respostas.

Uma função prompt_with_context_builder() já foi definida e está disponível para você. Essa função pega os documentos que o Pinecone indexou e junta tudo num prompt que o modelo de perguntas e respostas pode usar:

def prompt_with_context_builder(query, docs):
    delim = '\n\n---\n\n'
    prompt_start = 'Answer the question based on the context below.\n\nContext:\n'
    prompt_end = f'\n\nQuestion: {query}\nAnswer:'

    prompt = prompt_start + delim.join(docs) + prompt_end
    return prompt

Você vai implementar a função “ question_answering() ”, que vai dar ao modelo de linguagem da OpenAI, “ gpt-4o-mini ”, mais contexto e fontes pra responder suas perguntas.

Este exercício faz parte do curso

Bancos de dados vetoriais para incorporações com Pinecone

Ver curso

Instruções do exercício

Inicialize o cliente Pinecone com sua chave API (o cliente OpenAI está disponível em client).
Pega os três documentos mais parecidos com o texto query no namespace 'youtube_rag_dataset'.
Gerar uma resposta para os endereços prompt e sys_prompt usando o modelo 'gpt-4o-mini' da OpenAI, especificado usando o argumento da função chat_model.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the Pinecone client
pc = Pinecone(api_key="____")
index = pc.Index('pinecone-datacamp')

query = "How to build next-level Q&A with OpenAI"

# Retrieve the top three most similar documents and their sources
documents, sources = retrieve(____, top_k=____, namespace='____', emb_model="text-embedding-3-small")

prompt_with_context = prompt_with_context_builder(query, documents)
print(prompt_with_context)

def question_answering(prompt, sources, chat_model):
    sys_prompt = "You are a helpful assistant that always answers questions."
    
    # Use OpenAI chat completions to generate a response
    res = ____(
        model=____,
        messages=[
            {"role": "system", "content": ____},
            {"role": "user", "content": ____}
        ],
        temperature=0
    )
    answer = res.choices[0].message.content.strip()
    answer += "\n\nSources:"
    for source in sources:
        answer += "\n" + source[0] + ": " + source[1]
    
    return answer

answer = question_answering(
  prompt=prompt_with_context,
  sources=sources,
  chat_model='gpt-4o-mini')
print(answer)

Editar e executar o código

Bancos de dados vetoriais para incorporações com Pinecone

IntermediárioNível de habilidade

4.8+

1227 reviews