1. Nauka
  2. /
  3. Kursy
  4. /
  5. Developing LLM Applications with LangChain

Connected

ćwiczenie

Divizarea HTML

În acest exercițiu, vei diviza un fișier HTML care conține un ordin executiv privind inteligența artificială, emis de Casa Albă în octombrie 2023. Pentru a păstra cât mai mult context în fragmente, vei folosi valori mai mari pentru chunk_size și chunk_overlap.

Toate clasele LangChain necesare pentru acest exercițiu au fost pre-încărcate pentru tine.

Instrukcje

100 XP
  • Creează un UnstructuredHTMLLoader pentru white_house_executive_order_nov_2023.html și încarcă-l în memorie.
  • Setează un chunk_size de 300 și un chunk_overlap de 100.
  • Creează un RecursiveCharacterTextSplitter care să dividă după caracterul '.', apoi folosește metoda .split_documents() pentru a diviza data și afișează fragmentele.