Revele pela resposta
Pré-carregamos um objeto Response
, chamado response
, com o conteúdo de um site secreto. Sua tarefa é descobrir a URL e o título do site usando a variável de resposta. Você aprendeu a encontrar a URL na última lição. Para encontrar o título do site, o que você precisa saber é:
- O título é o texto do elemento
title
- O elemento
title
é filho do elementohead
, que é filho do elemento-raizhtml
.
Observação: o elemento-raiz html
tem apenas um elemento filho head
, e o elemento head
tem apenas um elemento filho title
.
Este exercício faz parte do curso
Raspagem da Web em Python
Instruções de exercício
- Atribua à variável
this_url
a URL usada para carregar a variávelresponse
. - Atribua à variável
this_title
o título do site usado para carregar a variávelresponse
. Como queremos apenas o texto do único elemento que vamos selecionar, usamos o métodoextract_first()
para extrair o texto. - Independentemente de você usar
xpath
oucss
, confira se está selecionando o texto contido no elemento de título, e não apenas o título em si.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )