LoslegenKostenlos loslegen

Antworten decken auf

Wir haben ein Response-Objekt mit dem Namen response mit dem Inhalt einer geheimen Website geladen. Deine Aufgabe ist es, die URL und den Titel der Website mithilfe der response-Variable herauszufinden. Du hast in der letzten Lektion gelernt, wie du die URL findest. Um den Titel der Website zu finden, musst du Folgendes wissen:

  • Der Titel ist der Text aus dem title-Element
  • Das title-Element ist ein Kind des head-Elements, das wiederum ein Kind des Wurzelelements html ist.

Zu beachten: Das Wurzelelement html hat nur ein untergeordnetes head-Element, und das head-Element hat nur ein untergeordnetes title-Element.

Diese Übung ist Teil des Kurses

Web Scraping in Python

Kurs anzeigen

Anleitung zur Übung

  • Weise der Variable this_url die URL zu, die zum Laden der Variable response verwendet wird.
  • Weise der Variable this_title den Titel der Website zu, die zum Laden der Variable response verwendet wird. Da wir nur den Text des einzelnen Elements, das wir auswählen wollen, benötigen, verwenden wir die Methode extract_first(), um den Text zu extrahieren.
  • Unabhängig davon, ob du xpath oder css verwendest, musst du darauf achten, dass du den Text innerhalb des Titelelements auswählst und nicht nur den Titel selbst.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Get the URL to the website loaded in response
this_url = ____

# Get the title of the website loaded in response
this_title = response.____.extract_first()

# Print out our findings
print_url_title( this_url, this_title )
Code bearbeiten und ausführen