1. Learn
  2. /
  3. 课程
  4. /
  5. Python Web 爬取

Connected

道练习

自引用很"优雅"

您可能已经注意到,在爬虫类中,我们总是在 start_requests 和 parse 方法里传入参数 self(就看本练习中的示例代码!)。这样做可以在类内部的方法之间互相引用。也就是说,如果我们想在 start_requests 方法中引用 parse 方法,就需要写成 self.parse,而不是只写 parse;添加 self 的作用是告诉代码:"去和 start_requests 同一个类里找名为 parse 的方法来用。"

在本练习中,您将实际动手体验这种"自引用"。

说明

100 XP
  • 在 YourSpider 类中填入所需的 scrapy 对象,以创建 scrapy 爬虫。
  • 在 start_requests 方法中,将字符串参数 "Hello World!" 传给空白处,以调用 print_msg 方法。