IniziaInizia gratis

Lancia gli URL

Nella prossima lezione parleremo del metodo start_requests all'interno della classe spider. In questo breve esercizio ti chiediamo di modificare una variabile nel metodo start_requests, anticipando alcuni concetti che vedremo a breve. In sostanza, vogliamo che tu prenda confidenza con alcuni meccanismi di una classe spider; in questo caso, creando una lista di urls nel metodo start_requests.

Abbiamo scritto una funzione inspect_class che stamperà la lista degli elementi presenti nella variabile urls all'interno del metodo start_requests.

Nota: nei prossimi esercizi scriverai del codice per completare la tua classe spider, ma il codice non include ancora le parti per eseguire davvero lo spider; arriveranno alla fine.

Questo esercizio fa parte del corso

Web Scraping in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Completa lo spazio vuoto nel metodo start_requests per assegnare alla variabile urls una lista con le due stringhe: "https://www.datacamp.com" e "https://scrapy.org".

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( scrapy.Spider ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    urls = ____
    for url in urls:
      yield url
  # parse method
  def parse( self, response ):
    pass
  
# Inspect Your Class
inspect_class( YourSpider )
Modifica ed esegui il codice