Svela con Response
Abbiamo pre-caricato un oggetto Response, chiamato response, con il contenuto di un sito web segreto. Il tuo compito è scoprire l'URL e il titolo del sito usando la variabile response. Hai già visto come trovare l'URL nella lezione precedente. Per trovare il titolo del sito, quello che ti serve sapere è:
- Il titolo è il testo dell'elemento
title - L'elemento
titleè figlio dell'elementohead, che è figlio dell'elemento radicehtml.
Nota: l'elemento radice html ha un solo elemento figlio head, e l'elemento head ha un solo elemento figlio title.
Questo esercizio fa parte del corso
Web Scraping in Python
Istruzioni dell'esercizio
- Assegna alla variabile
this_urll'URL usato per caricare la variabileresponse. - Assegna alla variabile
this_titleil titolo del sito web usato per caricare la variabileresponse. Poiché vogliamo solo il testo dall'unico elemento che selezioneremo, usa il metodoextract_first()per estrarre il testo. - Indipendentemente dal fatto che tu usi
xpathocss, assicurati di selezionare il testo all'interno dell'elemento title, e non solo l'elemento title stesso.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )