BaşlayınÜcretsiz Başlayın

Start Requests ile Başlamak

Son derste, bir scrapy spider içinde start_requests metodunu kurmayı öğrendik. Burada aslında hiçbir şey kazımayan ama start_requests metoduyla oynamanı sağlayan başka bir oyuncak-model spider var. Amacımız, start_requests içinde yaptığın scrapy.Request çağrısına hangi argümanları verdiğine aşina olmaya başlaman.

Önceki gibi, start_requests içinde yield ettiğini incelemek için inspect_class fonksiyonunu oluşturduk.

Bu egzersiz

Python ile Web Scraping

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • scrapy spider'ını oluşturmak için gereken scrapy nesnesini YourSpider sınıfına ekle.
  • start_requests metodundaki yield edilen scrapy.Request çağrısındaki boşluğu doldur; bu spider'ın başlayacağı URL "https://www.datacamp.com" olmalı ve siteyi ayrıştırmak için (YourSpider sınıfı içindeki) parse metodunu kullanmalı.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( ____ ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    yield scrapy.Request( ____ )
  # parse method
  def parse( self, response ):
    pass
  
# Inspect Your Class
inspect_class( YourSpider )
Kodu Düzenle ve Çalıştır