Çok sayfalı bir tarayıcıya hız sınırlaması (throttling) uygula
Bu egzersizin amacı, dünyanın en yüksek üç dağ zirvesinin koordinatlarını ve isimlerini almaktır.
Bu bilgiyi ilgili Wikipedia sayfalarından gerçek zamanlı olarak çekeceksin. Wikipedia’yı gereksiz yere yormamak için slowly() fonksiyonunu kullanarak hız sınırlaması uygulayacaksın. Her Wikipedia sayfası çağrısından sonra programın kısa bir süre beklemeli. Üç sayfa çok gibi görünmeyebilir, ama ilke tüm kazıma işlemleri için geçerlidir: nazik ol ve istekler arasında bekleme süresi ekle.
Zirvenin adını ID’si "firstHeading" olan öğede bulacaksın; koordinatlar ise ID’si "coordinates" olan bir öğenin alt öğesi olan ve sınıfı "geo-dms" olan bir öğenin içinde yer alır.
purrr önceden yüklendi ve URL’ler mountain_wiki_pages içinde bulunuyor.
Bu egzersiz
R ile Web Kazıma
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Define a throttled read_html() function with a delay of 0.5s
read_html_delayed <- ___(___,
rate = ___(___))