CommencerCommencer gratuitement

Hériter de l'araignée

Lorsque nous nous sommes familiarisés avec scrapy spiders, nous avons vu que la partie principale du code que nous devons ajuster est class pour le spider. Pour vous aider à vous familiariser avec la classe, vous allez réaliser un court morceau de code pour compléter un modèle réduit du code de la classe araignée. Nous avons omis le code qui exécuterait réellement l'araignée, en n'incluant que les éléments nécessaires à la création de la classe.

Comme nous l'avons mentionné dans la leçon, un site class est en gros une collection de variables et de fonctions apparentées logées ensemble. Parfois, une classe aime utiliser les méthodes d'une autre classe, et nous hériterons donc des méthodes d'une autre classe. C'est ce que nous faisons dans la classe araignée.

Nous avons écrit la fonction inspect_class pour regarder votre classe une fois que vous avez terminé, si vous voulez tester votre solution !

Cet exercice fait partie du cours

Web Scraping en Python

Afficher le cours

Instructions

  • Passez scrapy.Spider comme argument à la classe YourSpider; cela fera en sorte que YourSpider hérite des méthodes de scrapy.Spider.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider(____):
  name = "your_spider"
  # start_requests method
  def start_requests(self):
    pass
  # parse method
  def parse(self, response):
    pass
  
# Inspect Your Class
inspect_class(YourSpider)
Modifier et exécuter le code