Lanza las URL
En la próxima lección hablaremos del método start_requests
dentro de la clase araña. En este ejercicio rápido, te pedimos que cambies una variable dentro del método start_requests
, que prefigura parte de lo que aprenderemos en la próxima lección. Básicamente, queremos que empieces a sentirte cómodo girando algunas de las ruedas dentro de una clase araña; en este caso, haciendo una lista de urls
dentro del método start_requests
.
Hemos escrito una función inspect_class
que imprimirá la lista de elementos que tienes en la variable urls
dentro del método start_requests
.
Nota: en los próximos ejercicios, escribirás código para completar tu clase araña, pero el código aún no incluye las piezas para ejecutar realmente la araña; eso vendrá al final.
Este ejercicio forma parte del curso
Web scraping en Python
Instrucciones del ejercicio
- Rellena el espacio en blanco dentro del método
start_requests
para asignar a la variableurls
una lista con las dos cadenas:"https://www.datacamp.com"
y"https://scrapy.org"
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( scrapy.Spider ):
name = "your_spider"
# start_requests method
def start_requests( self ):
urls = ____
for url in urls:
yield url
# parse method
def parse( self, response ):
pass
# Inspect Your Class
inspect_class( YourSpider )