ComenzarEmpieza gratis

Lanza las URL

En la próxima lección hablaremos del método start_requests dentro de la clase araña. En este ejercicio rápido, te pedimos que cambies una variable dentro del método start_requests, que prefigura parte de lo que aprenderemos en la próxima lección. Básicamente, queremos que empieces a sentirte cómodo girando algunas de las ruedas dentro de una clase araña; en este caso, haciendo una lista de urls dentro del método start_requests.

Hemos escrito una función inspect_class que imprimirá la lista de elementos que tienes en la variable urls dentro del método start_requests.

Nota: en los próximos ejercicios, escribirás código para completar tu clase araña, pero el código aún no incluye las piezas para ejecutar realmente la araña; eso vendrá al final.

Este ejercicio forma parte del curso

Web scraping en Python

Ver curso

Instrucciones del ejercicio

  • Rellena el espacio en blanco dentro del método start_requests para asignar a la variable urls una lista con las dos cadenas: "https://www.datacamp.com" y"https://scrapy.org".

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( scrapy.Spider ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    urls = ____
    for url in urls:
      yield url
  # parse method
  def parse( self, response ):
    pass
  
# Inspect Your Class
inspect_class( YourSpider )
Editar y ejecutar código