Mit Startanfragen starten
In der letzten Lektion haben wir gelernt, wie man die Methode start_requests in einem scrapy-Spider einrichtet. Hier haben wir einen weiteren Spielzeug-Spider, der eigentlich nichts scrapt, aber dir die Möglichkeit gibt, mit der Methode start_requests zu spielen. Wir wollen, dass du dich mit den Argumenten vertraut machst, die du dem Aufruf von scrapy.Request in start_requests übergibst.
Wie zuvor haben wir die Funktion inspect_class erstellt, um zu untersuchen, was du in start_requests ermittelst.
Diese Übung ist Teil des Kurses
Web Scraping in Python
Anleitung zur Übung
- Füge das benötigte
scrapy-Objekt in die KlasseYourSpiderein, um denscrapy-Spider zu erstellen. - Fülle die Lücke im
scrapy.Request-Aufruf innerhalb der Methodestart_requestsaus, damit die URL, für die dieser Spider mit dem Scraping beginnt,"https://www.datacamp.com"ist und dieparse-Methode (innerhalb derYourSpider-Klasse) als Methode zum Parsen der Website verwendet wird.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( ____ ):
name = "your_spider"
# start_requests method
def start_requests( self ):
yield scrapy.Request( ____ )
# parse method
def parse( self, response ):
pass
# Inspect Your Class
inspect_class( YourSpider )