1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การใช้งาน Hugging Face

Connected

แบบฝึกหัด

การดึงข้อความด้วย PyPDF

PyPDF ช่วยให้ดึงข้อความจาก PDF ได้สะดวก เหมาะสำหรับเอกสารหลายหน้า เช่น ไฟล์นโยบายต่างๆ

ในแบบฝึกหัดนี้ จะโหลดไฟล์ US_Employee_Policy.pdf ดึงเนื้อหาทีละหน้า แล้วรวมทุกหน้าเข้าเป็น string เดียว เพื่อเตรียมข้อความสำหรับ pipeline ตอบคำถาม

คำแนะนำ

100 XP
  • Import class ที่จำเป็นจาก pypdf แล้วใช้โหลดไฟล์ PDF
  • เข้าถึงแต่ละหน้าและดึงเนื้อหาออกมาโดยใช้ method ที่ถูกต้อง