1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Retrieval Augmented Generation (RAG) with LangChain

Connected

Cvičení

Načítání PDF souborů pro RAG

Než začneš implementovat Retrieval Augmented Generation (RAG), musíš nejprve načíst dokumenty, ke kterým bude mít model přístup. Tyto dokumenty mohou pocházet z různých zdrojů a LangChain podporuje načítače dokumentů pro celou řadu z nich.

V tomto cvičení použiješ načítač dokumentů k načtení PDF souboru obsahujícího článek Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks od Lewise a kol. (2021). Soubor je dostupný jako 'rag_paper.pdf'.

Poznámka: pypdf, závislost potřebná pro načítání PDF dokumentů v LangChainu, je už nainstalovaná.

Pokyny

100 XP
  • Importuj odpovídající třídu pro načítání PDF dokumentů v LangChainu.
  • Vytvoř načítač dokumentů pro soubor 'rag_paper.pdf'.
  • Načti dokument do paměti a zobraz obsah prvního dokumentu, resp. stránky.