1. Learn
  2. /
  3. Курси
  4. /
  5. Робота з Hugging Face

Connected

вправа

Видобування тексту за допомогою PyPDF

PyPDF дає змогу видобувати текст із PDF, що спрощує роботу з багатосторінковими документами, як-от файлові політики.

У цій вправі ви завантажите US_Employee_Policy.pdf, по сторінках видобудете його вміст і обʼєднаєте все в один рядок, щоб підготувати текст для конвеєра запитань і відповідей.

Інструкції

100 XP
  • Імпортуйте потрібний клас із pypdf і використайте його, щоб завантажити PDF-файл.
  • Доступайтеся до кожної сторінки та видобувайте її вміст за допомогою відповідного методу.