Çocuk sayısına göre düğümleri çıkar
Videoda gösterildiği gibi, XPATH count() fonksiyonu, bir önermenin içinde kullanılarak seçimi belirli bir çocuk sayısını sağlayan düğümlerle daraltmak için kullanılabilir. Bu, özellikle kazıyıcın bazı düğümlerin en az belirli sayıda çocuğa sahip olmasına bağlıysa çok işe yarar.
İşte kazıyor olabileceğin bir sayfadan bir alıntı (hiçbir class veya ID olmadan…):
...
<div>
<h1>Tomorrow</h1>
</div>
<div>
<h2>Berlin</h2>
<p>Temperature: 20°C</p>
<p>Humidity: 50%</p>
</div>
<div>
<h2>London</h2>
<p>Temperature: 15°C</p>
</div>
<div>
<h2>Zurich</h2>
<p>Temperature: 22°C</p>
<p>Humidity: 60%</p>
</div>
...
Uygulaman tam olmayan hava tahminleriyle pek başa çıkamadığı için, yalnızca tam olarak bir h2 başlığı ve en az iki paragrafı olan divlerle ilgileniyorsun.
Yukarıdaki HTML'e forecast_html üzerinden erişebilirsin.
Bu egzersiz
R ile Web Kazıma
kursunun bir parçasıdırEgzersiz talimatları
count()fonksiyonundan yararlanarak, uygun XPATH seçiciyle istenendivleri seç.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Select only divs with one header and at least two paragraphs
forecast_html %>%
html_elements(xpath = '___')