1. Learn
  2. /
  3. Cursuri
  4. /
  5. Lucrul cu Hugging Face

Connected

exercițiu

Extragerea textului cu PyPDF

PyPDF ne permite să extragem text din fișiere PDF, simplificând lucrul cu documente de mai multe pagini, precum fișierele de politici.

În acest exercițiu, vei încărca fișierul US_Employee_Policy.pdf, vei extrage conținutul pagină cu pagină și îl vei combina într-un singur șir de caractere, pregătind textul pentru un pipeline de răspuns la întrebări.

Instrucțiuni

100 XP
  • Importă clasa necesară din pypdf și folosește-o pentru a încărca fișierul PDF.
  • Accesează fiecare pagină și extrage conținutul acesteia folosind metoda corectă.