BaşlayınÜcretsiz Başlayın

Çok sayfalı bir tarayıcıya hız sınırlaması (throttling) uygula

Bu egzersizin amacı, dünyanın en yüksek üç dağ zirvesinin koordinatlarını ve isimlerini almaktır.

Bu bilgiyi ilgili Wikipedia sayfalarından gerçek zamanlı olarak çekeceksin. Wikipedia’yı gereksiz yere yormamak için slowly() fonksiyonunu kullanarak hız sınırlaması uygulayacaksın. Her Wikipedia sayfası çağrısından sonra programın kısa bir süre beklemeli. Üç sayfa çok gibi görünmeyebilir, ama ilke tüm kazıma işlemleri için geçerlidir: nazik ol ve istekler arasında bekleme süresi ekle.

Zirvenin adını ID’si "firstHeading" olan öğede bulacaksın; koordinatlar ise ID’si "coordinates" olan bir öğenin alt öğesi olan ve sınıfı "geo-dms" olan bir öğenin içinde yer alır.

purrr önceden yüklendi ve URL’ler mountain_wiki_pages içinde bulunuyor.

Bu egzersiz

R ile Web Kazıma

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Define a throttled read_html() function with a delay of 0.5s
read_html_delayed <- ___(___, 
                         rate = ___(___))
Kodu Düzenle ve Çalıştır