1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 웹 스크레이핑

Connected

연습 문제

여러 페이지 크롤러에 스로틀링 적용하기

이 연습 문제의 목표는 지구에서 가장 높은 산봉우리 3개의 좌표와 이름을 가져오는 것입니다.

이 정보는 해당 산의 Wikipedia 페이지에서 실시간으로 가져옵니다. Wikipedia에 과도한 부담을 주지 않기 위해 slowly() 함수를 사용해 스로틀링을 적용할 거예요. Wikipedia 페이지를 한 번 호출할 때마다 프로그램이 잠깐 대기하도록 하세요. Wikipedia 3페이지 정도는 많지 않을 수 있지만, 원칙은 모든 스크레이핑에 동일하게 적용됩니다. 항상 예의를 지켜 요청 사이에 대기 시간을 추가하세요.

봉우리의 이름은 ID "firstHeading"인 요소 안에 있고, 좌표는 ID "coordinates"인 요소의 하위(자손) 요소 중 class "geo-dms"인 요소 안에 있습니다.

purrr는 미리 불러와졌고, URL은 mountain_wiki_pages에 들어 있습니다.

지침 1/3

undefined XP
    1
    2
    3
  • 루프에서 실행될 때 0.5초 지연을 두고 실행되는 read_html() 함수를 구성하세요.