1. Learn
  2. /
  3. 课程
  4. /
  5. Python Web 爬取

Connected

道练习

爬虫时间

这是您第一次动手编写一个会在站点之间爬取的 spider(先从一个站点收集链接,再跟随这些链接去解析新的页面)。这个 spider 从简化版的 DataCamp 课程目录开始,在 parse 方法中提取课程链接;随后它会跟随这些链接,在 parse_descr 方法中从每个课程页面提取课程描述,并将这些描述加入列表 course_descrs。您的任务是补全代码,让这个 spider 按预期运行!

我们已创建函数 inspect_spider,如果您做对了,它会打印出您抓取到的其中一个课程描述!

说明

100 XP
  • 在下面两个解析方法中各填一个空,用合适的参数让 spider 能够从第一个解析方法正确跳转到第二个。