Funzione di question answering RAG

Ci sei quasi! L’ultimo tassello del flusso RAG è integrare i documenti recuperati con un modello di question answering.

Una funzione prompt_with_context_builder() è già stata definita e resa disponibile. Questa funzione prende i documenti recuperati dall’indice Pinecone e li integra in un prompt che il modello di question answering può elaborare:

def prompt_with_context_builder(query, docs):
    delim = '\n\n---\n\n'
    prompt_start = 'Answer the question based on the context below.\n\nContext:\n'
    prompt_end = f'\n\nQuestion: {query}\nAnswer:'

    prompt = prompt_start + delim.join(docs) + prompt_end
    return prompt

Implementerai la funzione question_answering(), che fornirà al modello linguistico di OpenAI gpt-4o-mini contesto aggiuntivo e fonti con cui potrà rispondere alle tue domande.

Questo esercizio fa parte del corso

Database vettoriali per Embeddings con Pinecone

Visualizza corso

Istruzioni dell'esercizio

Inizializza il client Pinecone con la tua chiave API (il client OpenAI è disponibile come client).
Recupera i tre documenti più simili al testo query dal namespace 'youtube_rag_dataset'.
Genera una risposta al prompt e al sys_prompt forniti usando il modello 'gpt-4o-mini' di OpenAI, specificato tramite l’argomento di funzione chat_model.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Initialize the Pinecone client
pc = Pinecone(api_key="____")
index = pc.Index('pinecone-datacamp')

query = "How to build next-level Q&A with OpenAI"

# Retrieve the top three most similar documents and their sources
documents, sources = retrieve(____, top_k=____, namespace='____', emb_model="text-embedding-3-small")

prompt_with_context = prompt_with_context_builder(query, documents)
print(prompt_with_context)

def question_answering(prompt, sources, chat_model):
    sys_prompt = "You are a helpful assistant that always answers questions."
    
    # Use OpenAI chat completions to generate a response
    res = ____(
        model=____,
        messages=[
            {"role": "system", "content": ____},
            {"role": "user", "content": ____}
        ],
        temperature=0
    )
    answer = res.choices[0].message.content.strip()
    answer += "\n\nSources:"
    for source in sources:
        answer += "\n" + source[0] + ": " + source[1]
    
    return answer

answer = question_answering(
  prompt=prompt_with_context,
  sources=sources,
  chat_model='gpt-4o-mini')
print(answer)

Modifica ed esegui il codice

Database vettoriali per Embeddings con Pinecone

IntermediárioNível de habilidade

4.8+

1825 reviews