IniziaInizia gratis

Fallo con httr

Ecco del codice rvest che ho usato per trovare l'altitudine di un posto bellissimo dove ho passato le vacanze di recente.

# Get the HTML document from Wikipedia
wikipedia_page <- read_html('https://en.wikipedia.org/wiki/Varigotti')
# Parse the document and extract the elevation from it
wikipedia_page %>% 
  html_elements('table tr:nth-child(9) > td') %>% 
  html_text()

Come hai visto nel video, read_html() in realtà invia una richiesta HTTP GET se gli passi un URL, come in questo caso.

L'obiettivo di questo esercizio è replicare la stessa richiesta senza read_html(), ma usando invece i metodi di httr.

Nota: di solito rvest basta e avanza, ma se vuoi personalizzare le richieste come vedrai più avanti in questo capitolo, dovrai conoscere anche l'approccio con httr.

Per fare un po' di ripasso, tradurrai anche il selettore CSS usato in html_elements() in una query XPATH.

Questo esercizio fa parte del corso

Web scraping in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Get the HTML document from Wikipedia using httr
wikipedia_response <- ___('https://en.wikipedia.org/wiki/Varigotti')
# Parse the response into an HTML doc
wikipedia_page <- ___(___)
Modifica ed esegui il codice