Pilih berdasarkan class dan ID dengan XPATH
Berikut adalah beberapa kode HTML yang mirip dengan yang Anda jumpai di bab sebelumnya (sudah dibaca ke dalam dokumen HTML bernama weather_html):
<html>
<body>
<div id = 'first'>
<h1 class = 'big'>Berlin Weather Station</h1>
<p class = 'first'>Temperature: 20°C</p>
<p class = 'second'>Humidity: 45%</p>
</div>
<div id = 'second'>...</div>
<div id = 'third'>
<p class = 'first'>Sunshine: 5hrs</p>
<p class = 'second'>Precipitation: 0mm</p>
</div>
</body>
</html>
Untuk bab ini, kodenya sedikit lebih mendekati kasus nyata. Tujuan Anda adalah mengekstrak pembacaan curah hujan (precipitation) dari stasiun cuaca ini. Sayangnya, elemen tersebut tidak dapat dirujuk langsung melalui sebuah ID.
Mari kita bangun langkah demi langkah komponen dasarnya, lalu gunakan secara gabungan!
Latihan ini adalah bagian dari kursus
Web Scraping di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select all p elements
weather_html %>%
html_elements(xpath = '___')