1. 学ぶ
  2. /
  3. コース
  4. /
  5. Web Scraping với Python

Connected

演習

Ném các URL vào cuộc

Trong bài học tiếp theo, chúng ta sẽ nói về phương thức start_requests trong lớp spider. Ở bài tập nhanh này, bạn sẽ thay đổi một biến trong phương thức start_requests, như một bước dạo đầu cho những gì sẽ học ở bài sau. Nói ngắn gọn, bạn sẽ làm quen với việc “vặn vài nút” trong lớp spider; cụ thể ở đây là tạo một danh sách urls trong phương thức start_requests.

Chúng tôi đã viết sẵn hàm inspect_class để in ra danh sách các phần tử có trong biến urls bên trong phương thức start_requests của bạn.

Lưu ý: ở một vài bài tập tiếp theo, bạn sẽ viết mã để hoàn thiện lớp spider, nhưng hiện tại mã vẫn chưa có phần để thực sự chạy spider; phần đó sẽ xuất hiện ở cuối chương.

指示

100 XP
  • Điền vào chỗ trống trong phương thức start_requests để gán biến urls một danh sách gồm hai chuỗi: "https://www.datacamp.com" và "https://scrapy.org".