Antworten decken auf
Wir haben ein Response
-Objekt mit dem Namen response
mit dem Inhalt einer geheimen Website geladen. Deine Aufgabe ist es, die URL und den Titel der Website mithilfe der response-Variable herauszufinden. Du hast in der letzten Lektion gelernt, wie du die URL findest. Um den Titel der Website zu finden, musst du Folgendes wissen:
- Der Titel ist der Text aus dem
title
-Element - Das
title
-Element ist ein Kind deshead
-Elements, das wiederum ein Kind des Wurzelelementshtml
ist.
Zu beachten: Das Wurzelelement html
hat nur ein untergeordnetes head
-Element, und das head
-Element hat nur ein untergeordnetes title
-Element.
Diese Übung ist Teil des Kurses
Web Scraping in Python
Anleitung zur Übung
- Weise der Variable
this_url
die URL zu, die zum Laden der Variableresponse
verwendet wird. - Weise der Variable
this_title
den Titel der Website zu, die zum Laden der Variableresponse
verwendet wird. Da wir nur den Text des einzelnen Elements, das wir auswählen wollen, benötigen, verwenden wir die Methodeextract_first()
, um den Text zu extrahieren. - Unabhängig davon, ob du
xpath
odercss
verwendest, musst du darauf achten, dass du den Text innerhalb des Titelelements auswählst und nicht nur den Titel selbst.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )