BaşlayınÜcretsiz başlayın

Çok sayfalı bir tarayıcıya hız sınırlaması (throttling) uygula

Bu egzersizin amacı, dünyanın en yüksek üç dağ zirvesinin koordinatlarını ve isimlerini almaktır.

Bu bilgiyi ilgili Wikipedia sayfalarından gerçek zamanlı olarak çekeceksin. Wikipedia’yı gereksiz yere yormamak için slowly() fonksiyonunu kullanarak hız sınırlaması uygulayacaksın. Her Wikipedia sayfası çağrısından sonra programın kısa bir süre beklemeli. Üç sayfa çok gibi görünmeyebilir, ama ilke tüm kazıma işlemleri için geçerlidir: nazik ol ve istekler arasında bekleme süresi ekle.

Zirvenin adını ID’si "firstHeading" olan öğede bulacaksın; koordinatlar ise ID’si "coordinates" olan bir öğenin alt öğesi olan ve sınıfı "geo-dms" olan bir öğenin içinde yer alır.

purrr önceden yüklendi ve URL’ler mountain_wiki_pages içinde bulunuyor.

Bu egzersiz, kursun bir parçasıdır

R ile Web Kazıma

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Define a throttled read_html() function with a delay of 0.5s
read_html_delayed <- ___(___, 
                         rate = ___(___))
Kodu Düzenle ve Çalıştır