Lakukan dengan cara httr
Berikut adalah beberapa kode rvest yang saya gunakan untuk mencari ketinggian sebuah tempat indah yang baru-baru ini saya kunjungi saat berlibur.
# Dapatkan dokumen HTML dari Wikipedia
wikipedia_page <- read_html('https://en.wikipedia.org/wiki/Varigotti')
# Urai dokumen dan ekstrak nilai ketinggiannya
wikipedia_page %>%
html_elements('table tr:nth-child(9) > td') %>%
html_text()
Seperti yang Anda pelajari di video, read_html() sebenarnya melakukan permintaan HTTP GET jika diberikan sebuah URL, seperti pada kasus ini.
Tujuan latihan ini adalah mereplikasi kueri yang sama tanpa read_html(), melainkan dengan metode httr.
Catatan: Biasanya rvest sudah memadai, tetapi jika Anda ingin menyesuaikan permintaan seperti yang akan ditunjukkan nanti di bab ini, Anda perlu mengetahui cara httr.
Sebagai sedikit pengulangan, Anda juga akan menerjemahkan selektor CSS yang digunakan di html_elements() menjadi kueri XPATH.
Latihan ini adalah bagian dari kursus
Web Scraping di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the HTML document from Wikipedia using httr
wikipedia_response <- ___('https://en.wikipedia.org/wiki/Varigotti')
# Parse the response into an HTML doc
wikipedia_page <- ___(___)