IniziaInizia gratis

Svela con Response

Abbiamo pre-caricato un oggetto Response, chiamato response, con il contenuto di un sito web segreto. Il tuo compito è scoprire l'URL e il titolo del sito usando la variabile response. Hai già visto come trovare l'URL nella lezione precedente. Per trovare il titolo del sito, quello che ti serve sapere è:

  • Il titolo è il testo dell'elemento title
  • L'elemento title è figlio dell'elemento head, che è figlio dell'elemento radice html.

Nota: l'elemento radice html ha un solo elemento figlio head, e l'elemento head ha un solo elemento figlio title.

Questo esercizio fa parte del corso

Web Scraping in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Assegna alla variabile this_url l'URL usato per caricare la variabile response.
  • Assegna alla variabile this_title il titolo del sito web usato per caricare la variabile response. Poiché vogliamo solo il testo dall'unico elemento che selezioneremo, usa il metodo extract_first() per estrarre il testo.
  • Indipendentemente dal fatto che tu usi xpath o css, assicurati di selezionare il testo all'interno dell'elemento title, e non solo l'elemento title stesso.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Get the URL to the website loaded in response
this_url = ____

# Get the title of the website loaded in response
this_title = response.____.extract_first()

# Print out our findings
print_url_title( this_url, this_title )
Modifica ed esegui il codice