Gunakan predikat untuk memilih node berdasarkan anaknya
Berikut ini hampir sama seperti HTML sebelumnya. Selain itu, div ketiga memiliki elemen anak p dengan kelas third.
<html>
<body>
<div id = 'first'>
<h1 class = 'big'>Berlin Weather Station</h1>
<p class = 'first'>Temperature: 20°C</p>
<p class = 'second'>Humidity: 45%</p>
</div>
<div id = 'second'>...</div>
<div id = 'third'>
<p class = 'first'>Sunshine: 5hrs</p>
<p class = 'second'>Precipitation: 0mm</p>
<p class = 'third'>Snowfall: 0mm</p>
</div>
</body>
</html>
Dengan XPATH, hal yang tidak dapat dilakukan dengan CSS menjadi mungkin: memilih elemen berdasarkan properti keturunannya. Untuk ini, Anda dapat menggunakan predikat. Di sini, tujuan akhirnya adalah memilih hanya elemen div yang memuat elemen p dengan kelas third. Untuk itu, Anda perlu memilih hanya div yang memenuhi predikat tertentu — memiliki keturunan tersebut (tidak harus anak langsung). Anda akan melakukannya selangkah demi selangkah.
Sekali lagi, HTML di atas disediakan sebagai weather_html.
Latihan ini adalah bagian dari kursus
Web Scraping di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select all divs
weather_html %>%
___(xpath = ___)