CommencerCommencer gratuitement

L'autoréférence, c'est la classe

Vous avez probablement remarqué que dans la classe spider, nous saisissons toujours l'argument self dans les méthodes start_requests et parse (il suffit de regarder l'exemple de code de cet exercice !). Cela nous permet de faire référence à d'autres méthodes au sein de la classe. En d'autres termes, si nous voulons faire référence à la méthode parse dans la méthode start_requests, nous devons écrire self.parse au lieu de parse; ce que fait l'écriture self, c'est indiquer au code ce qu'il faut faire : "Cherchez dans la même classe que start_requests une méthode appelée parse à utiliser."

Dans cet exercice, vous aurez l'occasion de jouer avec cet "auto-référencement".

Cet exercice fait partie du cours

Web Scraping en Python

Afficher le cours

Instructions

  • Remplissez l'objet scrapy requis dans la classe YourSpider nécessaire pour créer l'araignée scrapy.
  • Passez l'argument chaîne "Hello World!" pour remplir le vide dans la méthode start_requests afin d'utiliser la méthode print_msg.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( ____ ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    self.print_msg( ____ )
  # parse method
  def parse( self, response ):
    pass
  # print_msg method
  def print_msg( self, msg ):
    print( "Calling start_requests in YourSpider prints out:", msg )
  
# Inspect Your Class
inspect_class( YourSpider )
Modifier et exécuter le code