1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping với Python

Connected

Bài tập

Chọn từ một lựa chọn

Trong bài tập này, bạn sẽ tìm phần văn bản từ một phần tử h4 nằm trong một phần tử div cụ thể. Bài tập diễn ra theo từng bước: bước đầu tiên là chọn một nhóm các phần tử div, và bước thứ hai là thu hẹp vào phần tử đầu tiên, từ đó chúng ta sẽ lấy văn bản của phần tử h4. Quá trình thu hẹp dần phạm vi phần tử (ví dụ: đầu tiên là các phần tử div, rồi đến phần tử h4) là một ví dụ khác về "chaining", dù trông không hoàn toàn giống như trước.

Trong quá trình làm, có sẵn một biến first_div để bạn sử dụng. Hãy suy nghĩ kỹ first_div là kiểu đối tượng gì!

Hướng dẫn 1/2

undefined XP
    1
    2
  • Gán cho biến divs một SelectorList chọn tất cả các phần tử div thuộc lớp course-block.
  • Gán cho biến h4_text phần văn bản từ phần tử h4 duy nhất trong nội dung được chọn ở first_div. Vì chúng ta chỉ muốn văn bản từ một phần tử duy nhất sẽ được chọn, hãy dùng phương thức extract_first() để trích xuất văn bản.