Lancia gli URL
Nella prossima lezione parleremo del metodo start_requests all'interno della classe spider. In questo breve esercizio ti chiediamo di modificare una variabile nel metodo start_requests, anticipando alcuni concetti che vedremo a breve. In sostanza, vogliamo che tu prenda confidenza con alcuni meccanismi di una classe spider; in questo caso, creando una lista di urls nel metodo start_requests.
Abbiamo scritto una funzione inspect_class che stamperà la lista degli elementi presenti nella variabile urls all'interno del metodo start_requests.
Nota: nei prossimi esercizi scriverai del codice per completare la tua classe spider, ma il codice non include ancora le parti per eseguire davvero lo spider; arriveranno alla fine.
Questo esercizio fa parte del corso
Web Scraping in Python
Istruzioni dell'esercizio
- Completa lo spazio vuoto nel metodo
start_requestsper assegnare alla variabileurlsuna lista con le due stringhe:"https://www.datacamp.com"e"https://scrapy.org".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( scrapy.Spider ):
name = "your_spider"
# start_requests method
def start_requests( self ):
urls = ____
for url in urls:
yield url
# parse method
def parse( self, response ):
pass
# Inspect Your Class
inspect_class( YourSpider )