`href` ist hier
In einer früheren Aufgabe hast du einen CSS Locator-String erstellt, um die Hyperlink-Kinder (a
-Element) aller div
-Elemente auszuwählen, die zur Klasse "course-block"
gehören. Hier haben wir eine SelectorList
mit dem Namen course_as
erstellt und diese Hyperlink-Kinder ausgewählt.
Deine Aufgabe ist es nun, die folgenden Lücken auszufüllen, um die href
-Attributwerte aus diesen Elementen zu extrahieren. Dies ist ein weiteres Beispiel für eine Verkettung, wie wir sie in einer früheren Aufgabe gesehen haben.
Der Punkt hier ist, dass wir die Aufrufe der Methoden css
und xpath
miteinander verketten und kombinieren können! Wir helfen dir, die richtige Richtung einzuschlagen, indem wir dir die Lösung geben, wenn wir die Verkettung mit einem weiteren Aufruf der css
-Methode durchführen.
Diese Übung ist Teil des Kurses
Web Scraping in Python
Anleitung zur Übung
- Richte das
Selector
-Objektsel
ein und verwende denhtml
-String als Texteingabe. - Weise der Variable
hrefs_from_xpath
diehref
-Attributwerte aus den Elementen incourse_as
zu. Deine Lösung solltehrefs_from_css
entsprechen!
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
from scrapy import Selector
# Create a selector object from a secret website
sel = Selector( ____ )
# Select all hyperlinks of div elements belonging to class "course-block"
course_as = sel.css( 'div.course-block > a' )
# Selecting all href attributes chaining with css
hrefs_from_css = course_as.css( '::attr(href)' )
# Selecting all href attributes chaining with xpath
hrefs_from_xpath = course_as.xpath( ____ )