ComenzarEmpieza gratis

Iníciate en las solicitudes de inicio

En la última lección aprendimos a configurar el método start_requests dentro de una araña scrapy. Aquí tenemos otro modelo de araña de juguete que en realidad no hace scraping de nada, pero te da la oportunidad de jugar con el método start_requests. Lo que queremos es que empieces a familiarizarte con los argumentos que pasas a la llamada scrapy.Request dentro de start_requests.

Como antes, hemos creado la función inspect_class para examinar lo que estás produciendo en start_requests.

Este ejercicio forma parte del curso

Web scraping en Python

Ver curso

Instrucciones de ejercicio

  • Introduce en la clase YourSpider el objeto scrapy necesario para crear la araña scrapy.
  • Rellena el espacio en blanco de la llamada scrapy.Request realizada dentro del método start_requests para que el URL que esta araña empezaría a raspar sea "https://www.datacamp.com" y utilizaría el método parse (dentro de la clase YourSpider) como método para analizar el sitio web.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( ____ ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    yield scrapy.Request( ____ )
  # parse method
  def parse( self, response ):
    pass
  
# Inspect Your Class
inspect_class( YourSpider )
Editar y ejecutar código