1. Learn
  2. /
  3. Cursuri
  4. /
  5. Vývoj LLM aplikací s LangChain

Connected

exercițiu

Rozdělování HTML

V tomto cvičení rozdělíš HTML soubor obsahující výkonné nařízení o AI vydané Bílým domem v říjnu 2023. Aby si zachoval/a co nejvíce kontextu v jednotlivých úsecích, použiješ větší hodnoty chunk_size a chunk_overlap.

Všechny potřebné třídy LangChain jsou pro toto cvičení již předem načteny.

Instrucțiuni

100 XP
  • Vytvoř UnstructuredHTMLLoader pro soubor white_house_executive_order_nov_2023.html a načti ho do paměti.
  • Nastav chunk_size na 300 a chunk_overlap na 100.
  • Vytvoř RecursiveCharacterTextSplitter rozdělující na znaku '.' a pomocí metody .split_documents() rozděl data a vypiš jednotlivé úseky.