1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶWebスクレイピング

Connected

Exercise

複数ページのクローラーにスロットリングを適用する

この演習の目標は、世界で最も高い3つの山の座標とその名称を取得することです。

これらの情報は、それぞれのWikipediaページからリアルタイムで取得します。Wikipediaに過度な負荷をかけないよう、slowly() 関数でスロットリングを適用します。各Wikipediaページへのアクセスのたびに、プログラムは少し待機するようにします。3ページ程度なら大したことはないかもしれませんが、スクレイピングでは量に関わらず同じ原則が当てはまります。無理をせず、リクエストの間に待機時間を入れましょう。

山の名前は ID "firstHeading" の要素内にあり、座標は ID "coordinates" を持つ要素の子孫である、class "geo-dms" の要素内にあります。

purrr はすでに読み込まれており、URLは mountain_wiki_pages に入っています。

Instructions 1/3

undefined XP
    1
    2
    3
  • ループ内で実行されたときに0.5秒の遅延を入れて read_html() を実行する関数を作成してください。