1. Learn
  2. /
  3. Курси
  4. /
  5. Python Web 爬取

Connected

вправа

从 Start Requests 开始

在上一节课中,我们学习了如何在 scrapy 爬虫中设置 start_requests 方法。这里给出另一个简单示例的爬虫,它实际上不会抓取任何内容,但可以让您动手练习 start_requests 方法。我们的目标是让您开始熟悉在 start_requests 中传入 scrapy.Request 的各个参数。

与之前一样,我们已经创建了函数 inspect_class,用于检查您在 start_requests 中产出的内容。

Інструкції

100 XP
  • 在 YourSpider 类中补全创建 scrapy 爬虫所需的 scrapy 对象。
  • 在 start_requests 方法中产出的 scrapy.Request 调用里补全空白,使该爬虫开始抓取的 URL 为 "https://www.datacamp.com",并使用 parse 方法(位于 YourSpider 类中)来解析网页。