Aan de slagGa gratis aan de slag

Ontsluier met Response

We hebben een Response-object, response genaamd, vooraf geladen met de inhoud van een geheime website. Jouw taak is om met de response-variabele de URL en de titel van de website te achterhalen. In de vorige les heb je geleerd hoe je de URL vindt. Om de titel van de website te vinden, moet je weten:

  • De titel is de tekst van het title-element
  • Het title-element is een kind van het head-element, dat weer een kind is van het html-rootelement.

Let op: het html-rootelement heeft maar één kind: het head-element, en het head-element heeft maar één kind: het title-element.

Deze oefening maakt deel uit van de cursus

Webscraping in Python

Cursus bekijken

Oefeninstructies

  • Ken aan de variabele this_url de URL toe die is gebruikt om de variabele response te laden.
  • Ken aan de variabele this_title de titel van de website toe die is gebruikt om de variabele response te laden. Omdat we alleen de tekst van het ene geselecteerde element willen, gebruiken we de methode extract_first() om de tekst te extraheren.
  • Ongeacht of je xpath of css gebruikt, zorg ervoor dat je de tekst binnen het title-element selecteert, en niet alleen het element zelf.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Get the URL to the website loaded in response
this_url = ____

# Get the title of the website loaded in response
this_title = response.____.extract_first()

# Print out our findings
print_url_title( this_url, this_title )
Code bewerken en uitvoeren