Revele pela resposta
Pré-carregamos um objeto Response, chamado response, com o conteúdo de um site secreto. Sua tarefa é descobrir a URL e o título do site usando a variável de resposta. Você aprendeu a encontrar a URL na última lição. Para encontrar o título do site, o que você precisa saber é:
- O título é o texto do elemento
title - O elemento
titleé filho do elementohead, que é filho do elemento-raizhtml.
Observação: o elemento-raiz html tem apenas um elemento filho head, e o elemento head tem apenas um elemento filho title.
Este exercício faz parte do curso
Raspagem da Web em Python
Instruções do exercício
- Atribua à variável
this_urla URL usada para carregar a variávelresponse. - Atribua à variável
this_titleo título do site usado para carregar a variávelresponse. Como queremos apenas o texto do único elemento que vamos selecionar, usamos o métodoextract_first()para extrair o texto. - Independentemente de você usar
xpathoucss, confira se está selecionando o texto contido no elemento de título, e não apenas o título em si.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )