1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping với Python

Connected

Bài tập

Văn bản cấp cao nhất

Bài tập này yêu cầu bạn viết một chuỗi XPath và một chuỗi CSS Locator để trỏ tới văn bản của một phần tử đoạn văn p cụ thể. Phần tử p trong HTML được xác định duy nhất bởi thuộc tính id, là "p3". Với mẩu thông tin nhỏ này, bạn có thể tạo ra các chuỗi cần thiết; tuy nhiên, chúng tôi đã nạp sẵn biến html với một chuỗi chứa đoạn HTML có liên kết này, nếu bạn muốn xem qua.

Trong bài tập này, bạn chỉ chọn văn bản bên trong phần tử, không bao gồm văn bản của các thế hệ con/cháu của phần tử đó. Chúng tôi đã tạo sẵn hàm print_results để bạn so sánh xem các chuỗi của mình đang trỏ tới những phần tử nào.

Hướng dẫn

100 XP
  • Gán cho biến xpath một chuỗi XPath trỏ tới văn bản bên trong phần tử đoạn văn p có id bằng p3, và không bao gồm văn bản của các thế hệ con/cháu của phần tử p này.
  • Gán cho biến css_locator một chuỗi CSS Locator trỏ tới chính văn bản đó.