ComenzarEmpieza gratis

Hazlo al estilo httr

Aquí tienes un código de rvest que usé para averiguar la altitud de un lugar precioso donde pasé mis vacaciones recientemente.

# Get the HTML document from Wikipedia
wikipedia_page <- read_html('https://en.wikipedia.org/wiki/Varigotti')
# Parse the document and extract the elevation from it
wikipedia_page %>% 
  html_elements('table tr:nth-child(9) > td') %>% 
  html_text()

Como has visto en el vídeo, read_html() en realidad realiza una solicitud HTTP GET si le pasas una URL, como en este caso.

El objetivo de este ejercicio es replicar la misma consulta sin read_html(), usando en su lugar métodos de httr.

Nota: Normalmente rvest es suficiente, pero si quieres personalizar las solicitudes como verás más adelante en este capítulo, tendrás que conocer la forma de hacerlo con httr.

Para repasar un poco, también traducirás el selector CSS usado en html_elements() a una consulta XPATH.

Este ejercicio forma parte del curso

Web Scraping con R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Get the HTML document from Wikipedia using httr
wikipedia_response <- ___('https://en.wikipedia.org/wiki/Varigotti')
# Parse the response into an HTML doc
wikipedia_page <- ___(___)
Editar y ejecutar código