Iníciate en las solicitudes de inicio
En la última lección aprendimos a configurar el método start_requests dentro de una araña scrapy. Aquí tenemos otro modelo de araña de juguete que en realidad no hace scraping de nada, pero te da la oportunidad de jugar con el método start_requests. Lo que queremos es que empieces a familiarizarte con los argumentos que pasas a la llamada scrapy.Request dentro de start_requests.
Como antes, hemos creado la función inspect_class para examinar lo que estás produciendo en start_requests.
Este ejercicio forma parte del curso
Web scraping en Python
Instrucciones del ejercicio
- Introduce en la clase
YourSpiderel objetoscrapynecesario para crear la arañascrapy. - Rellena el espacio en blanco de la llamada
scrapy.Requestrealizada dentro del métodostart_requestspara que el URL que esta araña empezaría a raspar sea"https://www.datacamp.com"y utilizaría el métodoparse(dentro de la claseYourSpider) como método para analizar el sitio web.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( ____ ):
name = "your_spider"
# start_requests method
def start_requests( self ):
yield scrapy.Request( ____ )
# parse method
def parse( self, response ):
pass
# Inspect Your Class
inspect_class( YourSpider )