ComenzarEmpieza gratis

Aplica limitación de velocidad a un rastreador de varias páginas

El objetivo de este ejercicio es obtener las coordenadas de los tres picos montañosos más altos de la Tierra, junto con sus nombres.

Conseguirás esta información desde sus respectivas páginas de Wikipedia, en tiempo real. Para no cargar demasiado Wikipedia, aplicarás una limitación de velocidad usando la función slowly(). Después de cada llamada a una página de Wikipedia, tu programa debería esperar un pequeño intervalo de tiempo. Tres páginas quizá no sean muchas, pero el principio se aplica a cualquier volumen de scraping: sé cuidadoso y añade tiempo de espera entre solicitudes.

Encontrarás el nombre del pico dentro de un elemento con ID "firstHeading", mientras que las coordenadas están dentro de un elemento con la clase "geo-dms", que es un descendiente de un elemento con ID "coordinates".

purrr ya está precargado y las URL están en mountain_wiki_pages.

Este ejercicio forma parte del curso

Web Scraping con R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Define a throttled read_html() function with a delay of 0.5s
read_html_delayed <- ___(___, 
                         rate = ___(___))
Editar y ejecutar código