Partire con Start Requests

Nell'ultima lezione abbiamo visto come impostare il metodo start_requests all'interno di uno spider di scrapy. Qui abbiamo un altro spider di esempio che in realtà non estrae nulla, ma ti dà modo di fare pratica con il metodo start_requests. L'obiettivo è farti prendere confidenza con gli argomenti che passi alla chiamata scrapy.Request dentro start_requests.

Come prima, abbiamo creato la funzione inspect_class per esaminare ciò che stai restituendo in start_requests.

Questo esercizio fa parte del corso

Web Scraping in Python

Visualizza corso

Istruzioni dell'esercizio

Compila l'oggetto scrapy richiesto nella classe YourSpider, necessario per creare lo spider scrapy.
Completa lo spazio vuoto nella chiamata a scrapy.Request restituita nel metodo start_requests in modo che l'URL da cui questo spider inizierebbe a fare scraping sia "https://www.datacamp.com" e che utilizzi il metodo parse (all'interno della classe YourSpider) come metodo per analizzare il sito.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( ____ ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    yield scrapy.Request( ____ )
  # parse method
  def parse( self, response ):
    pass
  
# Inspect Your Class
inspect_class( YourSpider )

Modifica ed esegui il codice