Texto de todos os níveis
Este exercício é parecido com o anterior. A diferença é que você deve selecionar o texto de várias gerações de um determinado elemento.
Você deve escrever uma string XPath e de localizador CSS para direcionar ao texto de um parágrafo p
específico. O elemento p
no HTML é definido exclusivamente por seu atributo id
, que é "p3"
. Com essas pequenas informações, você deve ser capaz de criar as strings desejadas; no entanto, pré-carregamos a variável html
com uma string que contém o HTML do qual esse link faz parte, caso queira consultá-lo.
Neste exercício, você deve selecionar apenas o texto dentro do elemento, o que inclui todo o texto dentro das gerações futuras. Criamos a função print_results
para que você compare a quais elementos suas strings direcionam.
Este exercício faz parte do curso
Raspagem da Web em Python
Instruções de exercício
- Atribua à variável
xpath
uma string XPath que direcione ao texto no elemento de parágrafop
comid
igual ap3
, que inclua o texto de gerações futuras desse elementop
. - Atribua à variável
css_locator
uma string de um localizador CSS que direcione a esse mesmo texto.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create an XPath string to the desired text.
xpath = ____
# Create a CSS Locator string to the desired text.
css_locator = ____
# Print the text from our selections
print_results( xpath, css_locator )