Çocuk sayısına göre düğümleri çıkar

Videoda gösterildiği gibi, XPATH count() fonksiyonu, bir önermenin içinde kullanılarak seçimi belirli bir çocuk sayısını sağlayan düğümlerle daraltmak için kullanılabilir. Bu, özellikle kazıyıcın bazı düğümlerin en az belirli sayıda çocuğa sahip olmasına bağlıysa çok işe yarar.

İşte kazıyor olabileceğin bir sayfadan bir alıntı (hiçbir class veya ID olmadan…):

...
<div>
  <h1>Tomorrow</h1>
</div>
<div>
  <h2>Berlin</h2>
  <p>Temperature: 20°C</p>
  <p>Humidity: 50%</p>
</div>
<div>
  <h2>London</h2>
  <p>Temperature: 15°C</p>
</div>
<div>
  <h2>Zurich</h2>
  <p>Temperature: 22°C</p>
  <p>Humidity: 60%</p>
</div>
...

Uygulaman tam olmayan hava tahminleriyle pek başa çıkamadığı için, yalnızca tam olarak bir h2 başlığı ve en az iki paragrafı olan divlerle ilgileniyorsun.

Yukarıdaki HTML'e forecast_html üzerinden erişebilirsin.

Bu egzersiz, kursun bir parçasıdır

R ile Web Kazıma

Kursa Göz Atın

Egzersiz talimatları

count() fonksiyonundan yararlanarak, uygun XPATH seçiciyle istenen divleri seç.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Select only divs with one header and at least two paragraphs
forecast_html %>%
	html_elements(xpath = '___')

Kodu Düzenle ve Çalıştır