MulaiMulai sekarang secara gratis

Rujukan Diri Itu Keren

Anda mungkin telah memperhatikan bahwa di dalam kelas spider, kita selalu memasukkan argumen self pada metode start_requests dan parse (lihat saja kode contoh pada latihan ini!). Ini memungkinkan kita melakukan rujukan antarmetode di dalam kelas. Artinya, jika kita ingin merujuk ke metode parse di dalam metode start_requests, kita perlu menulis self.parse alih-alih hanya parse; penggunaan self memberi tahu kode: "Cari di kelas yang sama dengan start_requests untuk metode bernama parse yang akan digunakan."

Dalam latihan ini Anda akan berkesempatan untuk mencoba "rujukan diri" ini.

Latihan ini adalah bagian dari kursus

Web Scraping dengan Python

Lihat Kursus

Petunjuk latihan

  • Lengkapi objek scrapy yang diperlukan pada kelas YourSpider untuk membuat spider scrapy.
  • Teruskan argumen string "Hello World!" untuk mengisi bagian kosong dalam metode start_requests guna menggunakan metode print_msg.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( ____ ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    self.print_msg( ____ )
  # parse method
  def parse( self, response ):
    pass
  # print_msg method
  def print_msg( self, msg ):
    print( "Calling start_requests in YourSpider prints out:", msg )
  
# Inspect Your Class
inspect_class( YourSpider )
Edit dan Jalankan Kode