Ontsluier met Response
We hebben een Response-object, response genaamd, vooraf geladen met de inhoud van een geheime website. Jouw taak is om met de response-variabele de URL en de titel van de website te achterhalen. In de vorige les heb je geleerd hoe je de URL vindt. Om de titel van de website te vinden, moet je weten:
- De titel is de tekst van het
title-element - Het
title-element is een kind van hethead-element, dat weer een kind is van hethtml-rootelement.
Let op: het html-rootelement heeft maar één kind: het head-element, en het head-element heeft maar één kind: het title-element.
Deze oefening maakt deel uit van de cursus
Webscraping in Python
Oefeninstructies
- Ken aan de variabele
this_urlde URL toe die is gebruikt om de variabeleresponsete laden. - Ken aan de variabele
this_titlede titel van de website toe die is gebruikt om de variabeleresponsete laden. Omdat we alleen de tekst van het ene geselecteerde element willen, gebruiken we de methodeextract_first()om de tekst te extraheren. - Ongeacht of je
xpathofcssgebruikt, zorg ervoor dat je de tekst binnen het title-element selecteert, en niet alleen het element zelf.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )