1. Nauka
  2. /
  3. Kursy
  4. /
  5. Praca z Hugging Face

Connected

ćwiczenie

Wyodrębnianie tekstu za pomocą PyPDF

PyPDF umożliwia wyodrębnianie tekstu z plików PDF, co ułatwia pracę z wielostronicowymi dokumentami, takimi jak regulaminy.

W tym ćwiczeniu wczytasz plik US_Employee_Policy.pdf, wyodrębnisz jego zawartość strona po stronie i połączysz ją w jeden ciąg znaków – przygotowując tekst do użycia w potoku pytań i odpowiedzi.

Instrukcje

100 XP
  • Zaimportuj wymaganą klasę z pypdf i użyj jej do wczytania pliku PDF.
  • Przejdź przez kolejne strony i wyodrębnij ich zawartość, korzystając z odpowiedniej metody.