1. 학습
  2. /
  3. 강의
  4. /
  5. LangChain으로 배우는 Retrieval Augmented Generation (RAG)

Connected

연습 문제

RAG를 위한 HTML 파일 로딩

HTML처럼 복잡한 형식을 포함해, 다양한 형식에서 문서를 불러올 수 있어요.

HTML이 익숙하지 않다면, 웹페이지를 만드는 마크업 언어예요. 간단한 예시는 다음과 같아요:

<!DOCTYPE html>
<html>
<body>
  <h2>Heading</h2>
  <p>Here's some text and an image below:</p>
  <img src="image.jpg" alt="..." width="104" height="142">
</body>
</html>

이번 연습 문제에서는 DataCamp 블로그 게시물 웹페이지를 담은 HTML 파일을 로드해 보겠습니다. 필요한 클래스는 이미 임포트되어 있어요.

지침

100 XP
  • 현재 디렉터리의 datacamp-blog.html 파일을 로드하려면 UnstructuredHTMLLoader 클래스를 사용하세요.
  • 문서를 메모리로 로드하세요.
  • 첫 번째 문서의 페이지 콘텐츠를 출력하세요.
  • 첫 번째 문서의 메타데이터를 출력하세요.