BaşlayınÜcretsiz Başlayın

Çocuk sayısına göre düğümleri çıkar

Videoda gösterildiği gibi, XPATH count() fonksiyonu, bir önermenin içinde kullanılarak seçimi belirli bir çocuk sayısını sağlayan düğümlerle daraltmak için kullanılabilir. Bu, özellikle kazıyıcın bazı düğümlerin en az belirli sayıda çocuğa sahip olmasına bağlıysa çok işe yarar.

İşte kazıyor olabileceğin bir sayfadan bir alıntı (hiçbir class veya ID olmadan…):

...
<div>
  <h1>Tomorrow</h1>
</div>
<div>
  <h2>Berlin</h2>
  <p>Temperature: 20°C</p>
  <p>Humidity: 50%</p>
</div>
<div>
  <h2>London</h2>
  <p>Temperature: 15°C</p>
</div>
<div>
  <h2>Zurich</h2>
  <p>Temperature: 22°C</p>
  <p>Humidity: 60%</p>
</div>
...

Uygulaman tam olmayan hava tahminleriyle pek başa çıkamadığı için, yalnızca tam olarak bir h2 başlığı ve en az iki paragrafı olan divlerle ilgileniyorsun.

Yukarıdaki HTML'e forecast_html üzerinden erişebilirsin.

Bu egzersiz

R ile Web Kazıma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • count() fonksiyonundan yararlanarak, uygun XPATH seçiciyle istenen divleri seç.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Select only divs with one header and at least two paragraphs
forecast_html %>%
	html_elements(xpath = '___')
Kodu Düzenle ve Çalıştır