Start Requests ile Başlamak
Son derste, bir scrapy spider içinde start_requests metodunu kurmayı öğrendik. Burada aslında hiçbir şey kazımayan ama start_requests metoduyla oynamanı sağlayan başka bir oyuncak-model spider var. Amacımız, start_requests içinde yaptığın scrapy.Request çağrısına hangi argümanları verdiğine aşina olmaya başlaman.
Önceki gibi, start_requests içinde yield ettiğini incelemek için inspect_class fonksiyonunu oluşturduk.
Bu egzersiz
Python ile Web Scraping
kursunun bir parçasıdırEgzersiz talimatları
scrapyspider'ını oluşturmak için gerekenscrapynesnesiniYourSpidersınıfına ekle.start_requestsmetodundaki yield edilenscrapy.Requestçağrısındaki boşluğu doldur; bu spider'ın başlayacağı URL"https://www.datacamp.com"olmalı ve siteyi ayrıştırmak için (YourSpider sınıfı içindeki)parsemetodunu kullanmalı.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( ____ ):
name = "your_spider"
# start_requests method
def start_requests( self ):
yield scrapy.Request( ____ )
# parse method
def parse( self, response ):
pass
# Inspect Your Class
inspect_class( YourSpider )