Ragas-evaluatie van betrouwbaarheid (faithfulness)

In deze oefening ga je de betrouwbaarheid (faithfulness) evalueren van de RAG-architectuur die je aan het einde van hoofdstuk 1 hebt gebouwd. Deze chain is opnieuw voor je gedefinieerd en beschikbaar via de variabele chain.

Je gebruikt de meegeleverde query, de uitvoer van de chain en de opgehaalde documenten om de betrouwbaarheid te evalueren met het ragas-framework.

De benodigde classes zijn al voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Retrieval Augmented Generation (RAG) met LangChain

Bekijk cursus

Oefeninstructies

Voer een query uit op de retriever met de gegeven query en gebruik een list comprehension om de documenttekst uit elk opgehaald document te halen.
Definieer een ragas-faithfulness chain.
Evalueer de betrouwbaarheid (faithfulness) van de beschikbare RAG-chain; je moet de chain aanroepen om het antwoord te genereren.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

from ragas.metrics import faithfulness

# Query the retriever using the query and extract the document text
query = "How does RAG improve question answering with LLMs?"
retrieved_docs = [doc.____ for doc in retriever.____(____)]

# Define the faithfulness chain
faithfulness_chain = ____(____, llm=llm, embeddings=embeddings)

# Evaluate the faithfulness of the RAG chain
eval_result = ____({
  "question": ____,
  "answer": ____.____(query),
  "contexts": ____
})

print(eval_result)

Code bewerken en uitvoeren