Selecione por classe e ID com XPATH
Aqui está um trecho de HTML parecido com o que você viu no capítulo anterior (já lido em um documento HTML chamado weather_html):
<html>
<body>
<div id = 'first'>
<h1 class = 'big'>Berlin Weather Station</h1>
<p class = 'first'>Temperature: 20°C</p>
<p class = 'second'>Humidity: 45%</p>
</div>
<div id = 'second'>...</div>
<div id = 'third'>
<p class = 'first'>Sunshine: 5hrs</p>
<p class = 'second'>Precipitation: 0mm</p>
</div>
</body>
</html>
Neste capítulo, o código está um pouco mais próximo do que você encontra na prática. Seu objetivo é extrair a leitura de precipitação desta estação meteorológica. Infelizmente, não dá para referenciá-la diretamente por um ID.
Vamos fazer isso construindo os blocos passo a passo e depois combinando tudo!
Este exercício faz parte do curso
Web Scraping em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Select all p elements
weather_html %>%
html_elements(xpath = '___')