Iníciate en las solicitudes de inicio
En la última lección aprendimos a configurar el método start_requests
dentro de una araña scrapy
. Aquí tenemos otro modelo de araña de juguete que en realidad no hace scraping de nada, pero te da la oportunidad de jugar con el método start_requests. Lo que queremos es que empieces a familiarizarte con los argumentos que pasas a la llamada scrapy.Request
dentro de start_requests
.
Como antes, hemos creado la función inspect_class
para examinar lo que estás produciendo en start_requests
.
Este ejercicio forma parte del curso
Web scraping en Python
Instrucciones de ejercicio
- Introduce en la clase
YourSpider
el objetoscrapy
necesario para crear la arañascrapy
. - Rellena el espacio en blanco de la llamada
scrapy.Request
realizada dentro del métodostart_requests
para que el URL que esta araña empezaría a raspar sea"https://www.datacamp.com"
y utilizaría el métodoparse
(dentro de la claseYourSpider
) como método para analizar el sitio web.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( ____ ):
name = "your_spider"
# start_requests method
def start_requests( self ):
yield scrapy.Request( ____ )
# parse method
def parse( self, response ):
pass
# Inspect Your Class
inspect_class( YourSpider )