Este ejercicio forma parte del curso
Aprende la estructura de HTML. Empezaremos explicando por qué el web scraping puede ser una valiosa adición a tu caja de herramientas de la ciencia de datos y luego profundizaremos en algunos aspectos básicos de HTML. Terminamos el capítulo con una breve introducción sobre la notación XPath, que se utiliza para navegar por los elementos dentro del código HTML.
Aprovecha la sintaxis de XPath de para explorar los selectores scrapy. Ambos conceptos te llevarán a ser capaz de hacer scraping a un documento de HTML.
Ejercicio actual
Aprende la sintaxis de los localizadores CSS y empieza a jugar con la idea de encadenar localizadores CSS con XPath. También se presentan los objetos Respuesta, que se comportan como selectores, pero nos proporcionan herramientas adicionales para movilizar nuestro esfuerzo de scraping en varios sitios web.
Aprende a crear arañas web con scrapy. Estas arañas scrapy rastrearán varias páginas de Internet, siguiendo enlaces para hacer scraping automáticamente cada una de esas páginas según los procedimientos que hemos aprendido en los capítulos anteriores.