Faça do jeito do httr
Aqui está um código com rvest que usei para descobrir a altitude de um lugar lindo onde passei minhas férias recentemente.
# Obter o documento HTML da Wikipedia
wikipedia_page <- read_html('https://en.wikipedia.org/wiki/Varigotti')
# Fazer o parsing do documento e extrair a altitude
wikipedia_page %>%
html_elements('table tr:nth-child(9) > td') %>%
html_text()
Como você viu no vídeo, read_html() na verdade faz uma requisição HTTP GET quando recebe uma URL, como neste caso.
O objetivo deste exercício é reproduzir a mesma consulta sem read_html(), usando os métodos do httr no lugar.
Observação: normalmente rvest dá conta do recado, mas, se você quiser personalizar requisições como verá mais adiante neste capítulo, vai precisar saber fazer do jeito do httr.
Para reforçar, você também vai traduzir o seletor CSS usado em html_elements() para uma consulta XPATH.
Este exercício faz parte do curso
Web Scraping em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the HTML document from Wikipedia using httr
wikipedia_response <- ___('https://en.wikipedia.org/wiki/Varigotti')
# Parse the response into an HTML doc
wikipedia_page <- ___(___)