Rujukan Diri Itu Keren
Anda mungkin telah memperhatikan bahwa di dalam kelas spider, kita selalu memasukkan argumen self pada metode start_requests dan parse (lihat saja kode contoh pada latihan ini!). Ini memungkinkan kita melakukan rujukan antarmetode di dalam kelas. Artinya, jika kita ingin merujuk ke metode parse di dalam metode start_requests, kita perlu menulis self.parse alih-alih hanya parse; penggunaan self memberi tahu kode: "Cari di kelas yang sama dengan start_requests untuk metode bernama parse yang akan digunakan."
Dalam latihan ini Anda akan berkesempatan untuk mencoba "rujukan diri" ini.
Latihan ini adalah bagian dari kursus
Web Scraping dengan Python
Petunjuk latihan
- Lengkapi objek
scrapyyang diperlukan pada kelasYourSpideruntuk membuat spiderscrapy. - Teruskan argumen string
"Hello World!"untuk mengisi bagian kosong dalam metodestart_requestsguna menggunakan metodeprint_msg.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( ____ ):
name = "your_spider"
# start_requests method
def start_requests( self ):
self.print_msg( ____ )
# parse method
def parse( self, response ):
pass
# print_msg method
def print_msg( self, msg ):
print( "Calling start_requests in YourSpider prints out:", msg )
# Inspect Your Class
inspect_class( YourSpider )