IniziaInizia gratis

Seleziona per classe e ID con XPATH

Ecco del codice HTML simile a quello che hai visto nel capitolo precedente (già caricato in un documento HTML chiamato weather_html):

<html>
  <body>
    <div id = 'first'>
      <h1 class = 'big'>Berlin Weather Station</h1>
      <p class = 'first'>Temperature: 20°C</p>
      <p class = 'second'>Humidity: 45%</p>
    </div>
    <div id = 'second'>...</div>
    <div id = 'third'>
      <p class = 'first'>Sunshine: 5hrs</p>
      <p class = 'second'>Precipitation: 0mm</p>
    </div>
  </body>
</html>

Per questo capitolo, il codice è un po' più vicino alla realtà. Il tuo obiettivo è estrarre la misurazione delle precipitazioni da questa stazione meteo. Purtroppo, non può essere referenziata direttamente tramite un ID.

Facciamolo costruendo i tasselli passo dopo passo e poi usandoli in combinazione!

Questo esercizio fa parte del corso

Web scraping in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Select all p elements
weather_html %>%
	html_elements(xpath = '___')
Modifica ed esegui il codice