Pilih berdasarkan class dan ID dengan XPATH
Berikut adalah beberapa kode HTML yang mirip dengan yang Anda jumpai di bab sebelumnya (sudah dibaca ke dalam dokumen HTML bernama weather_html):
<html>
<body>
<div id = 'first'>
<h1 class = 'big'>Berlin Weather Station</h1>
<p class = 'first'>Temperature: 20°C</p>
<p class = 'second'>Humidity: 45%</p>
</div>
<div id = 'second'>...</div>
<div id = 'third'>
<p class = 'first'>Sunshine: 5hrs</p>
<p class = 'second'>Precipitation: 0mm</p>
</div>
</body>
</html>
Untuk bab ini, kodenya sedikit lebih mendekati kasus nyata. Tujuan Anda adalah mengekstrak pembacaan curah hujan (precipitation) dari stasiun cuaca ini. Sayangnya, elemen tersebut tidak dapat dirujuk langsung melalui sebuah ID.
Mari kita bangun langkah demi langkah komponen dasarnya, lalu gunakan secara gabungan!
Latihan ini merupakan bagian dari kursus
Web Scraping di R
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Select all p elements
weather_html %>%
html_elements(xpath = '___')