ComeçarComece de graça

Selecione por classe e ID com XPATH

Aqui está um trecho de HTML parecido com o que você viu no capítulo anterior (já lido em um documento HTML chamado weather_html):

<html>
  <body>
    <div id = 'first'>
      <h1 class = 'big'>Berlin Weather Station</h1>
      <p class = 'first'>Temperature: 20°C</p>
      <p class = 'second'>Humidity: 45%</p>
    </div>
    <div id = 'second'>...</div>
    <div id = 'third'>
      <p class = 'first'>Sunshine: 5hrs</p>
      <p class = 'second'>Precipitation: 0mm</p>
    </div>
  </body>
</html>

Neste capítulo, o código está um pouco mais próximo do que você encontra na prática. Seu objetivo é extrair a leitura de precipitação desta estação meteorológica. Infelizmente, não dá para referenciá-la diretamente por um ID.

Vamos fazer isso construindo os blocos passo a passo e depois combinando tudo!

Este exercício faz parte do curso

Web Scraping em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Select all p elements
weather_html %>%
	html_elements(xpath = '___')
Editar e executar o código