Wir werfen mit URLs um uns
In der nächsten Lektion werden wir über die Methode start_requests
innerhalb der Spider-Klasse sprechen. In dieser kurzen Aufgabe bitten wir dich, eine Variable in der Methode start_requests
zu ändern, die einen Vorgeschmack auf das gibt, was wir in der nächsten Lektion lernen werden. Wir wollen, dass du dich mit dem Drehen einiger Räder innerhalb einer Spider-Klasse vertraut machst – in diesem Fall mit der Erstellung einer Liste von urls
innerhalb der Methode start_requests
.
Wir haben eine Funktion inspect_class
geschrieben, die die Liste der Elemente in der Variable urls
innerhalb der Methode start_requests
ausgibt.
Hinweis: In den nächsten Aufgaben wirst du Code schreiben, um deine Spider-Klasse zu vervollständigen, aber der Code enthält noch nicht die Teile, um den Spider tatsächlich auszuführen – das kommt am Ende.
Diese Übung ist Teil des Kurses
Web Scraping in Python
Anleitung zur Übung
- Fülle die Lücke in der Methode
start_requests
aus, um der Variableurls
eine Liste mit den beiden Strings"https://www.datacamp.com"
und"https://scrapy.org"
zuzuweisen.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import scrapy library
import scrapy
# Create the spider class
class YourSpider( scrapy.Spider ):
name = "your_spider"
# start_requests method
def start_requests( self ):
urls = ____
for url in urls:
yield url
# parse method
def parse( self, response ):
pass
# Inspect Your Class
inspect_class( YourSpider )