LoslegenKostenlos loslegen

Wir werfen mit URLs um uns

In der nächsten Lektion werden wir über die Methode start_requests innerhalb der Spider-Klasse sprechen. In dieser kurzen Aufgabe bitten wir dich, eine Variable in der Methode start_requests zu ändern, die einen Vorgeschmack auf das gibt, was wir in der nächsten Lektion lernen werden. Wir wollen, dass du dich mit dem Drehen einiger Räder innerhalb einer Spider-Klasse vertraut machst – in diesem Fall mit der Erstellung einer Liste von urls innerhalb der Methode start_requests.

Wir haben eine Funktion inspect_class geschrieben, die die Liste der Elemente in der Variable urls innerhalb der Methode start_requests ausgibt.

Hinweis: In den nächsten Aufgaben wirst du Code schreiben, um deine Spider-Klasse zu vervollständigen, aber der Code enthält noch nicht die Teile, um den Spider tatsächlich auszuführen – das kommt am Ende.

Diese Übung ist Teil des Kurses

Web Scraping in Python

Kurs anzeigen

Anleitung zur Übung

  • Fülle die Lücke in der Methode start_requests aus, um der Variable urls eine Liste mit den beiden Strings "https://www.datacamp.com" und "https://scrapy.org" zuzuweisen.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import scrapy library
import scrapy

# Create the spider class
class YourSpider( scrapy.Spider ):
  name = "your_spider"
  # start_requests method
  def start_requests( self ):
    urls = ____
    for url in urls:
      yield url
  # parse method
  def parse( self, response ):
    pass
  
# Inspect Your Class
inspect_class( YourSpider )
Code bearbeiten und ausführen