LoslegenKostenlos loslegen

`href` ist hier

In einer früheren Aufgabe hast du einen CSS Locator-String erstellt, um die Hyperlink-Kinder (a-Element) aller div-Elemente auszuwählen, die zur Klasse "course-block" gehören. Hier haben wir eine SelectorList mit dem Namen course_as erstellt und diese Hyperlink-Kinder ausgewählt.

Deine Aufgabe ist es nun, die folgenden Lücken auszufüllen, um die href-Attributwerte aus diesen Elementen zu extrahieren. Dies ist ein weiteres Beispiel für eine Verkettung, wie wir sie in einer früheren Aufgabe gesehen haben.

Der Punkt hier ist, dass wir die Aufrufe der Methoden css und xpath miteinander verketten und kombinieren können! Wir helfen dir, die richtige Richtung einzuschlagen, indem wir dir die Lösung geben, wenn wir die Verkettung mit einem weiteren Aufruf der css-Methode durchführen.

Diese Übung ist Teil des Kurses

Web Scraping in Python

Kurs anzeigen

Anleitung zur Übung

  • Richte das Selector-Objekt sel ein und verwende denhtml-String als Texteingabe.
  • Weise der Variable hrefs_from_xpath die href-Attributwerte aus den Elementen in course_as zu. Deine Lösung sollte hrefs_from_css entsprechen!

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from scrapy import Selector

# Create a selector object from a secret website
sel = Selector( ____ )

# Select all hyperlinks of div elements belonging to class "course-block"
course_as = sel.css( 'div.course-block > a' )

# Selecting all href attributes chaining with css
hrefs_from_css = course_as.css( '::attr(href)' )

# Selecting all href attributes chaining with xpath
hrefs_from_xpath = course_as.xpath( ____ )
Code bearbeiten und ausführen